LINUX.ORG.RU

Unicode 8.0

 , , ,


3

3

Unicode Consortium выпустил новую версию стандарта кодирования текстов Unicode — 8.0.

Самым нашумевшим изменением в новой версии стал стандарт для обозначения цвета кожи для символов эмодзи. Эти символы, появившиеся изначально в японской индустрии сотовых телефонов, на многих устройствах отображаются цветными, причём в виде человеческих лиц со светлым цветом кожи, а не в виде более или менее абстрактных «смайликов». Стандарт это разрешает и даже в некоторой степени регламентирует. Однако многие пользователи были недовольны тем фактом, что эти смайлики всегда отображаются с одним и тем же цветом кожи, чаще всего светлым, так что невозможно было, скажем, вставить символ U+1F478 PRINCESS 👸 так, чтобы эта принцесса была негритянкой.

Теперь такая возможность есть. Символы с U+1F3FB по U+1F3FF будут сделаны модификаторами для эмодзи, обозначающими шесть тонов кожи по шкале Фитцпатрика (первый — самый светлый, шестой — самый тёмный, но первый и второй тона не различаются). Символ эмодзи, за которым следует один из этих модификаторов, должен будет отображаться соответствующим цветом. Таким образом U+1F478 + U+1F3FB = 👸🏻 (белая принцесса), U+1F478 + U+1F3FD = 👸🏽 (смуглая принцесса), а U+1F478 + U+1F3FF = 👸🏿 (чёрная принцесса). Эмодзи без указания цвета кожи следует отображать в нейтральном, неестественном цвете, например, жёлто-оранжевом.

Возможность вставки в текст «разноцветных» эмодзи уже появилась в последних версиях ПО от Apple — основного лоббиста нововведения. Вероятно, пользователи Mac OS X и iOS увидят эффект даже в этом тексте, если только в этой новости показ эмодзи картинками не будет отключён настройками сайта или браузера.

Консорциум отмечает, что хотя добавленных функций не хватит, чтобы отразить всё разнообразие вида Homo Sapiens (например, нельзя сделать «азиатское лицо» или U+1F46A FAMILY 👪 с несколькими разными цветами кожи), всё же основная задача Юникода — кодирование текстов, поэтому сложные изображения следует пересылать в виде изображений.

Не обошлось без курьёзов. Например, некоторые азиатские пользователи техники Apple не поняли, что «дефолтный» жёлтый — это нейтральный цвет, и решили, что это крайне оскорбительная расистская выходка.

Из менее забавных нововведений:

  • Знаки слогового письма Чероки в нижнем регистре в дополнение к уже имевшимся знакам Чероки.
  • Много новых унифицированных иероглифов CJK.
  • Добавлен символ грузинской валюты лари.
  • Добавлены символы языков ик, куланго и некоторых другх африканских языков.
  • Письменность ахом для одноимённого индийского языка.
  • Новые арабские буквы для арви — тамильского языка, записанного арабскими буквами.
  • В общей сложности 6 новых письменностей и 7716 новых символов.

Стоит отметить, что консорциум Unicode перешёл на новую схему выпусков. Теперь выпуск новых версий стандарта будет происходить в июне-июле каждого года. Увеличиваться будет старшая цифра версии (предыдущий выпуск был 7.0, следующий, предположительно, будет 9.0), кроме промежуточных выпусков, которые если и будут делаться, то только при острой необходимости. Это позволит тем, кому надо постоянно следить за стандартом, знать, когда готовиться к новому выпуску. Кардинальных изменений в структуре стандарта, вроде того, что произошло при переходе от Unicode 1.1 к 2.0 больше, предположительно, не будет никогда.

>>> Сообщение о выпуске

★★★★★

Проверено: Shaman007 ()

А почему желтороты поставили по дефолту, а не белого человека?

sehellion ★★★★★ ()
Ответ на: комментарий от KRoN73

Ну и кроме того там же админы утверждали что в юникоде нет клингонского.

Ну и согласно википедии

Some modern invented scripts which have not yet been included in Unicode (e.g., Tengwar) or which do not qualify for inclusion in Unicode due to lack of real-world use (e.g., Klingon) are listed in the ConScript Unicode Registry, along with unofficial but widely used Private Use Area code assignments.

The ConScript Unicode Registry is a volunteer project to coordinate the assignment of code points in the Unicode Private Use Area for the encoding of artificial scripts for constructed languages.

RiseOfDeath ★★★★ ()
Ответ на: комментарий от KRoN73

Почти все в этом списке даже не подозревали о существовании этой недобуквы. Она загрязняет текст, не говоря уже о том, что за основу взята неверная графема.

anonymous ()
Ответ на: комментарий от Legioner

письма когда-нибудь вообще писал? бумажные, в конвертах (не телеграммы, а именно письма)?

buratino ★★★★ ()
Ответ на: комментарий от anonymous

ждём экспертной оценки букв «ь», «ъ», «ы», «э», «й», «ф»... да чего уж там, и всех остальных. назовите букву, сударь, на которую вы не наложите вердикт «не нужно». хотя бы одну.

buratino ★★★★ ()
Ответ на: комментарий от buratino

Последние 15 лет бог миловал. А в чём проблема писать смайлы в бумажных письмах? Особо гиканутые могут даже нигерийскую принцессу в hex-виде прописать.

Legioner ★★★★★ ()
Ответ на: комментарий от buratino

сударь, на которую вы не наложите вердикт «не нужно». хотя бы одну.

Штук 15 букв латиницы, наверное, должно хватить, если проникнуться духом минимализма :)

stook 15 bookf latinisi tolsno nafernoe kfatit...

KRoN73 ★★★★★ ()
Ответ на: комментарий от Legioner

Я говорю о том, как писали бумажные письма без смайлов.

У меня даже письма родственников с фронта где-то должны быть. Безо всяких смайлов. Но с живыми эмоциями.

buratino ★★★★ ()
Ответ на: комментарий от KRoN73

Вот я и хочу увидеть этот момент трансформации, когда из ненужниста полезет это самое слово «нужно!». Если это вообще возможно.

buratino ★★★★ ()
Ответ на: комментарий от buratino

Ну, раз ты просишь, так и быть. Йотированность, звонкость и мягкость обозначать модификаторами базовой графемы. Это позволит сильно сократить алфавит за счет исключения парных согласных, йотированных гласных и ненужных Ы, Ь и Ъ. Базовые графемы не должны быть похожими. Никаких Б/В, Ш/Ц и т. п. не должно быть. Вот как-то так.

anonymous ()
Ответ на: комментарий от KRoN73

Штук 15 букв латиницы
букв латиницы

В топку! Нужна новая хорошо различимая графика.

anonymous ()
Ответ на: комментарий от KRoN73

Ну мне тоже кажется, что нормой для русского — использование буквы «ё», а не «е» и модификатора

Так ведь в русском письмо алфавитное, а в бенгальском — абугида (консонантно-слоговое), побочная родственница деванагари. Там модификация одного символа другим и лигатуры — обычное дело.

proud_anon ★★★★★ ()
Последнее исправление: proud_anon (всего исправлений: 1)
Ответ на: комментарий от buratino

Ну я гарантирую что буквы «Х», «У» и некоторые другие буквы русского алфавита исключить нельзя, так как на них зиждется вся русская словесность.

RiseOfDeath ★★★★ ()
Ответ на: комментарий от Dmitry_Sokolowsky

Но зачем?

Очевидно же: для пользователей, говорящих на языке Чероки.

Фикс: пишуших. Говорящим пох на юникод.

massimus ★★★ ()
Ответ на: комментарий от anonymous

а теперь напиши всё это же самое, но по указанным правилам. дабы прониклись мы красотой и глубиной этого языка.

buratino ★★★★ ()
Ответ на: комментарий от buratino

чё нажать в Debian 8.0, чтобы увидеть чёрную принцессу?

Редтьюбком нажми, она там где-то под чёрным властелином.

massimus ★★★ ()
Ответ на: комментарий от buratino

а теперь напиши всё это же самое, но по указанным правилам.

Для этого нужно сначала новую графику разработать, она сама не разработается.

дабы прониклись мы красотой и глубиной этого языка.

Ты из тех, кто путает язык и письменность?

anonymous ()

Не обошлось без курьёзов. Например, некоторые азиатские пользователи техники Apple не поняли, что «дефолтный» жёлтый — это нейтральный цвет, и решили, что это крайне оскорбительная расистская выходка.

Могли бы сделать зеленый нейтральным цветом. Вообще бы ни у кого вопросов не было.

Infra_HDC ★★★★★ ()
Ответ на: комментарий от anonymous

Ты из тех, кто путает язык и письменность?

нет, я нормальный. а ты продолжай, продолжай.

buratino ★★★★ ()
Ответ на: комментарий от buratino

нет, я нормальный. а ты продолжай, продолжай.

Э нет, постой. Поясни-ка сперва, про красоту и глубину какого «этого» языка ты говорил, ежели ты нормальный, как утверждаешь.

anonymous ()

Посылать негру чёрный смайлик - это расизм

anonymous ()
Ответ на: комментарий от anonymous

— Добро пожаловать в Общество зануд! Возьмите себе стул.
— Вообще-то, у этого, как вы выразились, стула, нет спинки, так что технически это табуретка.
— Похоже, у нас новый председатель!

Ещё есть про осла анекдот. А пересказывать свою статью про недовольных пуристов мне вообще лень.

Абсолютно уверен, что ваша новая письменность будет сверхтехничной, сверхидеальной, но абсолютно неприспособленной для людей, оторванной от жизни.

buratino ★★★★ ()
Ответ на: комментарий от Dmitry_Sokolowsky

У японцев кстати чем-то похожая система, вот только обходятся одним регистром. А эти, очевидно, опять косят под европейцев.

olibjerd ★★★★★ ()
Ответ на: комментарий от AP

Там лошадка уже есть, надо теперь больше цветов прикрутить

olibjerd ★★★★★ ()
Ответ на: комментарий от andreyu

Угу, теперь текст стал пестрым из-за этих морд.

Мак? Скрин дашь?

sambist ★★ ()
Ответ на: комментарий от int13h

Какой практический смысл несут вот эти изменения??

На консорциум насели условные чёрные принцессы с феминизмом головного мозга и активной гражданской позицией. Как это им удалось дело десятое, но теперь у них из-под ног выбили почву, и пацаны могут работать, не опасаясь за своё ментальнео состояние.

anonymous ()

Примечательно, что белую принцессу, 👸🏻, пока что не умеет искать ни Google, ни Yandex. В отличии от Yahoo, который хоть что-то выплевывает о принцессах.

Infra_HDC ★★★★★ ()
Ответ на: комментарий от buratino

то есть, Пушкина ты читал с постной рожей, не понимая, где смешно, где грустно, и вообще, где что происходит?

А ты, стало быть, не различаешь эпистолярный стиль и телеграфный? Челобитные начальству, надеюсь, хотя бы хореем пишешь?

anonymous ()
Ответ на: комментарий от KRoN73

Ну мне тоже кажется, что нормой для русского — использование буквы «ё», а не «е» и модификатора :)

На самом деле русскоязычным пользователям просто повезло. Те же франкоязычные пользователи, несмотря на AZERTY, совершенно не стесняются пользоваться модификаторами для всех своих диактриков попадись им QWERTY, а зачастую и по собственному сознательному выбору.

anonymous ()
Ответ на: комментарий от buratino

Это потому что они спокойно сидели и писали письма, а не набирали его на Т9 одним глазом, управляя автомобилем.

Legioner ★★★★★ ()
Ответ на: комментарий от anonymous

да запросто. осталось только выяснить, что такое «челобитные» и что такое «начальство»

buratino ★★★★ ()
Ответ на: комментарий от Legioner

Какой пиздец. Пилю кастомные поля ввода, ну и как мне теперь эту херню реализовывать?

sambist ★★ ()
Ответ на: комментарий от Legioner

да и сейчас жизнь стала бы намного лучше, если бы спокойно сидели и писали письма, а не набирали его на Т9 одним глазом, управляя автомобилем

buratino ★★★★ ()
Ответ на: комментарий от Kompilainenn

Чайковский написал балет, Романов написал историю. И шрифт гражданский придумал.

olibjerd ★★★★★ ()

Вообще-то новость хороша. Требование к лазерному принтеру: поддержка стандарта UNICODE 8.0 => принтер должен быть цветным.

Infra_HDC ★★★★★ ()
Последнее исправление: Infra_HDC (всего исправлений: 2)
Ответ на: комментарий от buratino

да и сейчас жизнь стала бы намного лучше, если бы спокойно сидели и писали письма, а не набирали его на Т9 одним глазом, управляя автомобилем

Может быть стала бы, может быть не стала бы. По факту сейчас смайлы важны и ничего с этим не поделаешь.

Legioner ★★★★★ ()
Ответ на: комментарий от sambist

Какой пиздец. Пилю кастомные поля ввода, ну и как мне теперь эту херню реализовывать?

А в чём проблема? Смайл это просто юникодная графема. Как его добавлять? На мобильных платформах стандартная клавиатура умеет. На стационарных обычно делают отдельную кнопку для смайлов, если она имеет смысл в этом приложении.

Legioner ★★★★★ ()
Ответ на: комментарий от buratino

Ты будешь шокирован, но в письмах даже рисовать можно!

anonymous ()
Ответ на: комментарий от Legioner

Смайл это просто юникодная графема

Да нифига то что показано в топике не хрюникодная графема. Хрюникод это 😿. А эти графические «принцессы» - это изображения. Мне теперь поддержку графических изображений со всеми вытекающими последствиями и уязвимостями пилить в поле ввода, которое может быть полем ввода например какой-нибудь бизнес-логики? Не находите, что это идиотизм со стороны консорциума?

sambist ★★ ()
Ответ на: комментарий от sambist

Оттого, как ты их называешь, они свою сущность не поменяют.

anonymous ()
Ответ на: комментарий от anonymous

Еще раз для особо умных - графема - часть шрифта. Изображение - это левое изображение, вырванное хрен знает откуда. Можете опровергнуть мои слова, когда в шрифтах появятся *цветные* принцессы в виде нативных символов. Вам напомнить, что растеризаторы делают чб глифы?

sambist ★★ ()
Ответ на: комментарий от sambist

Мне теперь поддержку графических изображений со всеми вытекающими последствиями и уязвимостями пилить в поле ввода

Так это, вроде, дело ОС 😃 Тебе же достаточно просто обычные символы обработать: 🐌 💐 👍.

https://twitter.com/balancer73/status/612991901579517952

KRoN73 ★★★★★ ()
Ответ на: комментарий от sambist

Можете опровергнуть мои слова, когда в шрифтах появятся *цветные* принцессы в виде нативных символов

Тебе не пофиг? Или ты для прикладных программ ещё и все шрифты разрабатываешь с рендерерами?

KRoN73 ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.