LINUX.ORG.RU

Соотношение кода символа его изображению

 


0

3

Добрый день. Имеется множество кодировок, в каждой кодировке символы имеют разные коды, как соотносится код символа с изображением (который задаёт шрифт)? В шрифтах зашит алгоритм для работы с различными кодировками или над кодировками имеется абстракция, которая переводит код одного символа (в различных кодировках) к одному значению?

в шрифтах зашит алгоритм для работы с различными кодировками

Разве что в шрифте termunal в офтопике.

Умный текстовый редактор может угадать кодировку, если она 8-ми битная, но в общем случае пользователю/программе самим приходится перебирать/задавать в тегах.

Современные шрифты скорее всего хранят глифы букв с привязкой к unicode.

При выборе кодировки по тегам или вручную коды преобразовывается.

UTF-8 сразу позволяет увидеть латиницу в любом редакторе, т.к. она кодируется последними 7-ю битами. Первый бит сигнализирует о том, что будет преобразование двух и более байт в символ.

Unicode кодирует символы 2 и более байтами. Его хватает для всех букв в мире.

tlx ★★★★★ ()

Спасибо за ответ. Да, шрифты заточены под конкретную кодировку (провёл небольшое исследование). Мой x-server знает 3170 шрифтов, из них юникодные 849.

pavlick ★★ ()
Ответ на: комментарий от tlx

Добавлю к вышесказанному, что буква не обязана состоять из одного глифа. Например буква «Й» (подозреваю что «Ы» тоже), а так же всякие умляуты, иероглифы и прочее прочее.

RiseOfDeath ★★★★ ()
Последнее исправление: RiseOfDeath (всего исправлений: 3)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.