LINUX.ORG.RU

История изменений

Исправление Xenius, (текущая версия) :

Любая однобайтная кодировка больше чем ASCII.

Я знаю. Но почти все содержат ASCII как подмножество. А почему бы не использовать кодировку, где первая половина таблицы распределена более экономно? Из управляющих символов больше половины не нужно, а нужные используются неоптимально.

К примеру, сочетание \r\n там где было бы достаточно просто \n. И роли значительной части символов плохо определены. Хотя гораздо удобнее было бы иметь отдельные символы для разрыва строки, разрыва абзаца, разрыва страницы, разрыва раздела с чётко определенными ролями вместо \r \n \v \f. И какое-то чётко заданое значение для символа \t, например как в концепции elastic tabstops.

В общем ASCII далеко не идеальна, но все пользуются и не проявляют ни малейшего желания что-то в ней менять, потому что единый везде стандарт, даже не очень хороший оказывается много лучше зоопарка стандартов. Вот так же и UTF-8, хоть и не во всём идеален, но гораздо лучше зоопарка устаревших однобайтных кодировок, которых для одной кириллицы около десятка.

И ни одной кодировки которая лучше UTF-8 пока нигде не внедрили.

Исходная версия Xenius, :

Любая однобайтная кодировка больше чем ASCII.

Я знаю. Но почти все содержат ASCII как подмножество. А почему бы не использовать кодировку, где первая половина таблицы распределена более экономно? Из управляющих символов больше половины не нужно, а нужные используются неоптимально.

К примеру, сочетание \r\n там где было бы достаточно просто \n. И роли значительной части символов плохо определены. Хотя гораздо удобнее было бы иметь отдельные символы для разрыва строки, разрыва абзаца, разрыва страницы, разрыва раздела с чётко определенными ролями вместо \r \n \v \f. И какое-то чётко заданое значение для символа \t, например как в концепции elastic tabstops.

В общем ASCII далеко не идеальна, но все пользуются и не проявляют ни малейшего желания что-то в ней менять, потому что единый везде стандарт, даже не очень хороший оказывается много лучше зоопарка стандартов. Вот так же и UTF-8, хоть и не во всём идеален, но гораздо лучше зоопарка однобайтных кодировок, которых для одной кириллицы около десятка.