LINUX.ORG.RU

Unicode 17.0

 , , ,


1

3

9 сентября состоялся выпуск 17.0 стандарта кодирования символов Unicode. В этой версии добавлены 4803 новых символа.

Новшества включают в себя:

На данный момент стандарт содержит 159801 символ, 172 письменности и 3953 эмодзи.

>>> Полное описание этой версии
>>> Файлы с данными

>>> Подробности в блоге unicode.org

★★★★★

Проверено: hobbit ()
Последнее исправление: dataman (всего исправлений: 5)
Ответ на: комментарий от energetix_user

Так я и пишу, что однобайтной не хватило бы.

monk ★★★★★
()
Ответ на: комментарий от watchcat382

Так я и пишу, что если бы за основу юникода взяли готовую систему Emacs или того же Chiwriter, было бы намного лучше.

А нынешнему уже не хватает разве что символов «начать векторное изображение» и «закончить векторное изображение». И встроенного языка типа PostScript.

monk ★★★★★
()
Ответ на: комментарий от monk

Я не количество символов критикую. Ну захотели все буквы всех языков в одну кодировку засунуть - ну допустим. В конце концов память у нынешних компов большая.

Я про то что кроме букв пихают всякий графический мусор. В досовской кодировке это были символы псевдографики - ну какое они имеют отношение к буквам письменности? Никакого. А сейчас вообще тысячи всяких картинок понапихали. Выше верно заметили - нет такого языка к которому можно было бы эти стрёмные картинки отнести. По аналогии - ну давайте тогда в русский алфавит добавим «букву»-изображение члена чтобы популярный посыл в известном направлении компактнее записывался. А что - часто же востребована будет:) Если убирали яти и еры то почему нельзя что-нибудь и добавить? :) Вот такая примерно аргументация получается.

Другая проблема излишнего изобилия символов - это огромное количество визуально похожих. Если программа выводит на экран к примеру символ «А» и мы знаем что комп работает в одной из русских кодировок - то это может быть либо латинская A либо русская А. Если же комп работает в юникоде - то это может быть не один десяток разных букв. Есть даже целые слова которые визуально одинаковы но читаются по-разному и означают разное на разных языках («beep» <-> «веер» например если заглавными буквами написать). Вот выдал комп на экран такое слово,а потом его потребовалось ввести с клавиатуры. И как?

watchcat382
()
Ответ на: комментарий от watchcat382

Я про то что кроме букв пихают всякий графический мусор.

Вот это как раз не проблема.

нет такого языка к которому можно было бы эти стрёмные картинки отнести

А эти картинки: «@#$%^&*№<>»? То, что люди изобретают удобные иероглифы, это нормально. А с учётом того, что два байта не хватает даже на китайские иероглифы, а три байта это 16 миллионов символов, то места хватает.

Вот лучше бы они явное знакоместо для каждого символа сделали, чем несколько способов написать один и тот же символ (в том числе «й» и «ё»).

Другая проблема излишнего изобилия символов - это огромное количество визуально похожих.

А это было всегда. Решается либо унификацией по изображению как сделали с иероглифами (китайские, корейские, японские одинаково выглядящие иероглифы являются одним символом юникода), тогда «ар» == «ap». Либо, как сейчас, понимать, что изображение не даёт полной информации о символе. И если надо получить точное значение, выводить его идентификатор.

В принципе, визуально похожих хватает и внутри одного алфавита: 1, I, l могут быть в некоторых шрифтах неразличимы. Или наши ш и щ, ь и ъ, О и 0.

monk ★★★★★
()
Ответ на: комментарий от Wapieth

Люди высказывают свои мнения. «Траур»-то тут при чём??..

Somebody ★★★
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.