Соотношение кода символа его изображению

0

3

Добрый день. Имеется множество кодировок, в каждой кодировке символы имеют разные коды, как соотносится код символа с изображением (который задаёт шрифт)? В шрифтах зашит алгоритм для работы с различными кодировками или над кодировками имеется абстракция, которая переводит код одного символа (в различных кодировках) к одному значению?

Ссылка

← oauth авторизация без браузера

Какие могут быть причины не использовать Typescript? →

в шрифтах зашит алгоритм для работы с различными кодировками

Разве что в шрифте termunal в офтопике.

Умный текстовый редактор может угадать кодировку, если она 8-ми битная, но в общем случае пользователю/программе самим приходится перебирать/задавать в тегах.

Современные шрифты скорее всего хранят глифы букв с привязкой к unicode.

При выборе кодировки по тегам или вручную коды преобразовывается.

UTF-8 сразу позволяет увидеть латиницу в любом редакторе, т.к. она кодируется последними 7-ю битами. Первый бит сигнализирует о том, что будет преобразование двух и более байт в символ.

Unicode кодирует символы 2 и более байтами. Его хватает для всех букв в мире.

tlx ★★★★★
(21.08.15 07:13:25 MSK)

Спасибо за ответ. Да, шрифты заточены под конкретную кодировку (провёл небольшое исследование). Мой x-server знает 3170 шрифтов, из них юникодные 849.

~~pavlick~~ ★★
(21.08.15 09:24:19 MSK) автор топика

Ссылка

Ответ на: комментарий от tlx 21.08.15 07:13:25 MSK

Добавлю к вышесказанному, что буква не обязана состоять из одного глифа. Например буква «Й» (подозреваю что «Ы» тоже), а так же всякие умляуты, иероглифы и прочее прочее.

RiseOfDeath ★★★★
(21.08.15 10:18:50 MSK)
Последнее исправление: RiseOfDeath 21.08.15 10:19:42 MSK (всего исправлений: 3)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← oauth авторизация без браузера

Development

Какие могут быть причины не использовать Typescript? →

Похожие темы