Домен в UTF-16

0

1

Возник такой вопрос: вот я вижу что в punycode можно закодировать только UTF-8. Потому возникает резонный вопрос - а возможны ли домены в UTF-16? Если да, то во что их кодировать?

Ссылка

← Django: покидайте годных мануалов

multiple definition of `...' →

utf-16 не нужен</thread>

mittorn ★★★★★
(29.09.17 13:19:02 MSK)

Ответ на: комментарий от mittorn 29.09.17 13:19:02 MSK

Koi8-r хватит всем! (с)

petrosyan ★★★★★
(29.09.17 13:20:27 MSK)

вот я вижу что в punycode можно закодировать только UTF-8.

А я вижу там code points, которые Unicode, а не UTF-8. Где там используется именно UTF-8?

i-rinat ★★★★★
(29.09.17 13:24:29 MSK)

Ссылка

Ответ на: комментарий от petrosyan 29.09.17 13:20:27 MSK

utf-8 хватит всем! (с)

пофиксил

mittorn ★★★★★
(29.09.17 13:24:34 MSK)

Ссылка

В UTF-16 у огромного числа букв ( в частности, английский алфавит ) будут байты с кодом 0x00

В си это означает конец строки. Си это огромное количество кода, в т.ч. ядро linux

Выводы? ;)

З.Ы. я тоже терпеть не могу идиотский utf-8, но этот наш линукс сейчас не потянет utf-16

router ★★★★★
(29.09.17 13:40:20 MSK)

Ответ на: комментарий от router 29.09.17 13:40:20 MSK

Потому что UTF-32 круче чем UTF-16. Больше влезает, плюс не надо думать сколько символов в строке в 1024 байта.

PPP328 ★★★★★
(29.09.17 13:45:32 MSK)

Ответ на: комментарий от PPP328 29.09.17 13:45:32 MSK

Рад за твою вселенную. Кстати, на чей вопрос ты отвечал?

router ★★★★★
(29.09.17 13:49:32 MSK)

Ответ на: комментарий от router 29.09.17 13:49:32 MSK

Ошибся вселенной

PPP328 ★★★★★
(29.09.17 14:50:31 MSK)

Ссылка

Вроде разобрался. Надо распиливать суррогатные пары.

Hater ★★
(29.09.17 14:51:55 MSK) автор топика

Ссылка

Ты точно понимаешь что utf8 и utf16 это просто варианты кодирования одного и того же unicode, при поддержке одного второй совершенно не нужен, а тем более угрёбищная utf16.

anonymous
(29.09.17 15:38:44 MSK)