LINUX.ORG.RU

вот я вижу что в punycode можно закодировать только UTF-8.

А я вижу там code points, которые Unicode, а не UTF-8. Где там используется именно UTF-8?

i-rinat ★★★★★
()

В UTF-16 у огромного числа букв ( в частности, английский алфавит ) будут байты с кодом 0x00

В си это означает конец строки. Си это огромное количество кода, в т.ч. ядро linux

Выводы? ;)

З.Ы. я тоже терпеть не могу идиотский utf-8, но этот наш линукс сейчас не потянет utf-16

router ★★★★★
()
Ответ на: комментарий от router

Потому что UTF-32 круче чем UTF-16. Больше влезает, плюс не надо думать сколько символов в строке в 1024 байта.

PPP328 ★★★★★
()

Вроде разобрался. Надо распиливать суррогатные пары.

Hater ★★
() автор топика

Ты точно понимаешь что utf8 и utf16 это просто варианты кодирования одного и того же unicode, при поддержке одного второй совершенно не нужен, а тем более угрёбищная utf16.

anonymous
()

а ведь есть еще utf-32

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.