LINUX.ORG.RU

Ответ на: комментарий от sT331h0rs3

Как альтернатива архиватору, но с выхлопом в виде текста.

Base65536 remains the state of the art for sending binary data through text-based systems which naively counts Unicode code points, particularly those using the fixed-width UTF-32 encoding.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Как альтернатива архиватору, но с выхлопом в виде текста.

Почему? Это аналог Base64, «новая кодировка» - звучит как кодировка текста, а там для файлов. Архиватор, он не обязан кодировать в моём понимании.

xwicked ★★☆
()

Ух какая знатная наркомания у этих ваших зумеров. Выхлоп кодировщика напоминает какую-то клинопись.

DawnCaster ★★
()
Последнее исправление: DawnCaster (всего исправлений: 1)

Название крутое)

Valeg ★★★
()

Если смотреть объективно, то даже 32 бит для кодирования символа – мало. Правильная кодировка должна не содержать разные регистры и «крышечки», как эти ваши UTF, а иметь некоторую базу для самого символа, а так же набор атрибутов, типа регистра или умляута. Так что 64 бита – это минимум для действительно нормальной кодировки.

quwy
()
Ответ на: комментарий от ratvier

Ждём Base4294967296

:D, но такой не будет. В этой задействован весь юникод, все символы. Сначала придумается кодировка текста с таким количеством символов(что невозможно без задействования ИИ), а потом уже новый кодировщик.

xwicked ★★☆
()
Ответ на: комментарий от ratvier

Дверь запили!

Segmentation fault...

Давай запиливай!

А мне это не нужно, мне base64 хватит. Я лишь написал, что человек не сможет столько символов придумать, нарисовать и оцифровать.

xwicked ★★☆
()
Последнее исправление: xwicked (всего исправлений: 1)
Ответ на: комментарий от ratvier

Давай, д-д-делай дверь

Segmentation fault[2]
Давай переводи на русский. Сделать дверь между измерениями? Мне зачем, я так перемещаюсь...

xwicked ★★☆
()
Ответ на: комментарий от WitcherGeralt

UTF-32

Где это используется вообще?

UTF-32, который нынче стал синонимом UCS-4 — это единственная штатная кодировка символов в API строк питона. Да, внутри есть три варианта хранения, но снаружи они все представляются как UCS-4 строки, за исключением специальных функций превращения в/из конкретной кодировки. Еще библиотеки для работы с текстами в UCS-4/UTF-32 любят переводить всё, чтобы один символ был одной позицией.

byko3y ★★★★
()
Ответ на: комментарий от quwy

Если смотреть объективно, то даже 32 бит для кодирования символа – мало. Правильная кодировка должна не содержать разные регистры и «крышечки», как эти ваши UTF, а иметь некоторую базу для самого символа, а так же набор атрибутов, типа регистра или умляута. Так что 64 бита – это минимум для действительно нормальной кодировки

Как правило, печатный язык весьма ограничен, даже китайский. Крышечки-палочки-смайлики — это уже наборные расширения, которые могут уходить по сложности в бесконечность.

byko3y ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.