LINUX.ORG.RU
ФорумTalks

Новая версия Яролита (форк ГОСТ 16876-71, табл 2)

 , ,


0

2

Выпущена новая версия яролита. Она почти равна русскому подмножеству ГОСТ 16876-71 (ISO/R 9:1968) (так случайно получилось).

V chashhakh juga zhil by citrus? Da, no falqshivyjj ehkzempljar!

Отличия от ГОСТ:

ь = q (перевернули мягкий знак)
ъ = jq (твёрдый знак разрезали и перевернули)
† = j8224j // любой юникод тоже представим
// Переключение языка с помощью последовательности
Ajj da xesukin xrsyn
// Добавлены дореформенные буквы (но их выкину в пользу братских и "небратских")
http://программирование-по-русски.рф/яролит.яргт/

Дальше изучаем тему. Буду складывать сюда всё, что найду:

http://meganorm.ru/Data2/1/4294835/4294835719.pdf - ГОСТ (ныне упразднён)

https://www.iso.org/standard/3587.html - история

https://www.ub2000.de/ru/kachestvo-perevodov/zaverennye-perevody-soglasno-sta... - пример использования (некоторые организации в германии требуют перевод по этому стандарту)

http://userscripts-mirror.org/scripts/review/89883 - кодировщик на JS для 1968 - неправильный, т.к. в нём й = j, а должно быть jj.

★★★★★

Последнее исправление: den73 (всего исправлений: 7)

Ответ на: комментарий от bodqhrohro_promo

Ммм, cкорее уж ГОСТ надо откапывать, потому что последующие стандарты не дают обратимости иа = ia = я. А вот посмотреть этот ГОСТ на предмет иных славянских значков (он был ещё и стандартом СЭВ) как раз имеет смысл.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

ничего, уйгуров научили, и весь остальной мир научат китайской письменности, делов-то :)

Harald ★★★★★
()
Ответ на: комментарий от den73

А обратимых общепризнанных транслитераций русчи нет. Это никому не нужно. Было бы нужно — давно был бы хоть один стандарт.

Thetan ★★★
()
Ответ на: комментарий от Harald

Ну вот зачем нужны такие тупые комментарии? Вроде уже пошёл почти конструктивный разговор людей, из которых я самый глупый, нет, надо обязательно влезть и отложить личинку.

den73 ★★★★★
() автор топика
Ответ на: комментарий от bodqhrohro_promo

Давно это было, хотя да, я скорее украинец, чем кто-либо. Вот что сказали мне:

Во-первых, у сербов есть своя система транлитерации (она же хорватская письменность). На wy они посмотрят как серб на хорвата

  Завтра обещали более развёрнутый ответ.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от Thetan

Слушай, ну, ты, наверное, очень умный. Но если я, ещё 2 человека, которым понадобился обратимый транслит и они его сделали, и даже СССР, сделавшие ГОСТ 16876-71 (обратимый стандарт транслитерации кириллицы, просто с использованием знаков препинания) - это «никто», то тогда ты и сам тоже никто.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от bodqhrohro_promo

Так. ГОСТ 16876-71, таблица 2 определяет обратимую транслитерацию русского, украинского, белорусского, болгарского, монгольского, сербско-хорватского и македонского языков с помощью модификаторов j и h. q,x,w вроде не задействованы. Посмотри пож. и сравни со своим решением, если время есть, конечно.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Ну самая очевидная проблема тут — не хватает некоторых символов. Нету болгарского ѝ (впрочем, я и сам его в текстах не встречал; видимо, редкая буква, типа наших ґ и ъ). Нету появившегося позже белорусского ў. А так, за вычетом префикса w, отличий почти нет. jz, пожалуй, даже удачнее wd, но на фоне её jd выглядит неравноправным.

Насчёт wy согласен — фигня полная, но это уже ты виноват, что забил более удачную jh под ять ;-) сам и раззабивай. В принципе, можно вместо неё использовать какую-то из j*, но тут любой из оставшихся вариантов выглядит неудачным.

И с љ/њ я тупанул — отбросил с учётом того, что они фактически используются вместо ль/нь и посему могут отображаться на lq/nq. Но раз система обратимая и речь идёт о режиме xr, а не каком-нибудь xs/xm, то надо и их ввести.

bodqhrohro_promo
()
Ответ на: комментарий от bodqhrohro_promo

Так ты и яти не трогал :) Нифига себе :) Их можно подвинуть или ради дружбы народов вовсе выкинуть. Остальное давай продолжим завтра. Лучше - по E-mail, а то мне кажется, что лучшее в теме уже сделано, дальше нужно просто поработать. P.S. ещё один чел сознался, что у него есть свой обратимый транслит, правда он пока его не опубликовал. Итого, уже 4, не считая СССР. Но у меня самый лучший - я угадал как в СССР, а расхождения по ьъ вызваны различием целей. Хахаха, я же говорил, что я гений.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 4)
Ответ на: комментарий от redgremlin

Вот, кстати, все эти над- и подстрочные значки выглядят намного более здраво, чем конструкции типа jq, jj и shh.

muon ★★★★
()
Ответ на: комментарий от muon

Выглядеть они могут как угодно, но в E-mail и имя пользователя Linux их никак не воткнёшь. Я свой транслит придумывал именно для таких задач, а не для красоты.

den73 ★★★★★
() автор топика
Ответ на: комментарий от muon

И машины, и люди. Например, в организации можно установить правило, что у человека Email - это фио через чёрточки. Тогда, чтобы написать Иванову Ивану Ивановичу, нужно написать на адрес ivanov-ivan-ivanovich@nekoe.mesto

Вот и всё. Для Ивана Ивановича задача может показаться тривиальной, но уже Пушкин Александр Сергеевич может конкретно озадачить.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 2)
Ответ на: комментарий от den73

Хотя изначально мне это было нужно, чтобы писать кириллицей на любом ЯП. Эта задача, в общем-то уже потеряла актуальность - я просто теперь предпочитаю те языки, где кириллицей писать можно - их теперь довольно много. Остаются мелочи - имена файлов, директорий, якоря в html и т.п. В посте все варианты использования описаны.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Вслепую отправляя письмо на ivanov-ivan-ivanovich@nekoe.mesto нельзя быть уверенным, что письмо попадёт тому Иван Иванычу, которому надо. Всё равно придётся заранее запросить у получателя его адрес, и тогда уже не важно, как называется ящик, хоть ivanov-ivan-ivanovich, хоть megaxakep2004.

muon ★★★★
()
Ответ на: комментарий от muon

Если не вслепую, то разница - в сложности диктовки. Но я всё это уже расписал

Звонит Сергей Кужугетович Владимиру Владимировичу и говорит: к нам летят томагавки. Вышлите координаты целей для ответного удара на E-mail. Владимир Владимирович: а напомните ваш E-mail, у меня под рукой нет записной книжки. Ш как w? или как sh? C как русское или как доллар? И т.п. Пока происходит этот разговор, томагавки как раз успеют долететь.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от den73

Вышлите координаты целей для ответного удара на E-mail

напомните ваш E-mail, у меня под рукой нет записной книжки

Суровый двадцатый век. Записная книжка, email, проводные телефоны.

Есть WhatsApp, Telegram, в крайнем случае SMS. Которые можно использовать для передачи любой информации, в том числе (если надо) и адресов email.

Я не против удобных для передачи голосом адресов. Но у меня пока даже не дошли руки создать ящик roma764@example.com специально для диктовки. А тут речь идёт о повсеместном внедрении. Работы много, а цель мизерная.

muon ★★★★
()
Ответ на: комментарий от muon

Ты рассматриваешь случай, когда e-mail - это просто некий ключ, безсмысленный набор букв, который нужно только передать по электронному каналу связи, не читая его. Потом не нужно его держать в голове и т.п. Но ведь e-mail может состоять из осмысленных слов. Например, roma, info, sales, admin. Это всё -английские слова. Если нужны русские, то приходится прибегать к транслиту.

Правила записи слов русского языка обычно соблюдаются. Без этого люди просто перестали бы понимать друг друга. А когда пишут в транслите, никаких правил нет - каждый изобретает свои. Ты считаешь, что это совершенно нормально и нет никакой проблемы? Т.е. для любого случая, когда применяют транслит, ты берёшься утверждать, что на самом деле начертание не важно?

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Если допустим, есть Иван Иванович, а адрес у него u25543543nmm@mesto.ru, то как ты будешь ассоциировать, что это иван иванович? Ты запишешь его в контакты под именем «Иван Иванович». Но если у тебя мейл иван-иванович@mesto.ru, то у тебя и так понятно, кто это. Тебе не нужно трудиться и записывать его в контакты. Разве это не профит? Но такая однозначность возможна только в том случае, если правила написания слов иван-иванович однозначны. Если он сегодня иван-иванович, а завтра 1345-1345D4789, то тебе опять же придётся добавлять к нему какую-то читаемую метку. А эту метку в итоге всё равно придётся держать в голове (без головы пока обойтись не удаётся, несмотря на вотсап).

Один из плюсов стандартизации транслита - в том, что иван-иванович всегда будет записан как иван-иванович. Но выгода здесь вполне измеримая. В других применениях, по сути, то же самое.

Русский текст закодирован в том английском тексте, которым он представлен. Информация не потеряна, и когда нам нужен русский текст, мы раскодируем транслит обратно. Если же мы вместо яролита возьмём современный стандарт для загранпаспартов, в котором яков = iakov = иаков, то мы вместе с транслитерированным текстом iakov вынуждены будем передать дополнительную информацию о том, как же он называется. Скажем, login = iakov, full name = яков. Если же транслит обратим, то без поля full name иногда можно обойтись.

В ИТ ещё полно мест, куда кириллица плохо лезет. Но я уже, похоже, 5-й раз переписываю свой пост в ЖЖ. Прочитай его.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 4)
Ответ на: комментарий от muon

C, G, X перед E и I читаются как Ч, Ж и Ш соответственно. Чтобы это предотвратить, используется H: cit — чит, chit — кит, ток — toc, ночь — noch.

Конечно, это всё всего лишь игра (для меня, по крайней мере), а подобный проект уже предложил в середине XIX века какой-то Кадинский.

Thetan ★★★
()
Ответ на: комментарий от den73

Интересно, почему ты взял этот устаревший стандарт вместо современного и более эстетичного ГОСТ 7.79—2000, и в каких сферах полностью обратимая транслитерация всё же получила сколько-нибудь широкое применение.

Thetan ★★★
()
Ответ на: комментарий от Thetan

Chitaiqi, coreiqi i iaponqi v ’etom plane molodqi. Nam bhi pinh‘inh.

Это как раз ГОСТ. А так у японцев тоже компания Фуджи-фильм в честь горы Фудзияма и Токио, которое на самом деле Токё (там тот же звук, что в кёкусинкай).

ATO na odnoi bancovscoi carte thi Alexandr, na drugoi Alexander, a v zagrane Aleksandr.

Так это вопрос происхождения имени. Если Путин получит паспорт в КНР, то получит фамилию Pujing вместо Putin. Если Александр русский, то Aleksandr, а если немец, то Alexander.

monk ★★★★★
()
Ответ на: комментарий от monk

А так у японцев тоже компания Фуджи-фильм в честь горы Фудзияма и Токио, которое на самом деле Токё (там тот же звук, что в кёкусинкай).

Это проблема двойной транслитерации. На латинице один хер Fuji и Tokyo без вариантов. Безграмотность русни это не проблема японцев.

Родина им дала систему Поливанова — пользуйся. Не хочу, хочу жрать говно и транслитерировать через английский.

Так это вопрос происхождения имени. Если Путин получит паспорт в КНР, то получит фамилию Pujing вместо Putin. Если Александр русский, то Aleksandr, а если немец, то Alexander.

Смотрю, ты не встречался с тем, что твоё имя по-разному написано в разных банковских картах. Одной и той же страны, замечу.

Thetan ★★★
()
Ответ на: комментарий от Thetan

Смотрю, ты не встречался с тем, что твоё имя по-разному написано в разных банковских картах. Одной и той же страны, замечу.

А у китайцев латиницей пишется одинаково, но читают так, что на имя совсем не похоже. Например, Си Цзиньпин становится через Xi Jinping Кси Джиньпином... Поэтому большинство китайцев за пределами Китая предпочитают себе взять имя типа Джон или Майк. Особенно, если имя Wang Dong Hui.

Смотрю, ты не встречался с тем, что твоё имя по-разному написано в разных банковских картах.

Имеешь право требовать транслитерировать по загранпаспорту, если это важно. Гораздо хуже, когда имя содержит букву ё, а в половине документов принудительно заменяется на е.

monk ★★★★★
()
Ответ на: комментарий от monk

Кстати, есть ещё проблема обратной траслитерации. Ivan Smith — это «Айвэн Смит» или «Иван Смит» или «Иван Кузнецов»?

monk ★★★★★
()
Ответ на: комментарий от monk

Xi Jinping Кси Джиньпином

Кто тебе сказал, что X это всегда «кс»? И опять таки, почему J всегда должно быть «дж»? Между прочим, в большинстве языков Европы это «й», а в испанском «х». Твоя проблема в том, что ты знаешь только один язык и на всё смотришь сквозь его призму.

Латиница, в отличие от кириллицы, более абстрактный алфавит.

Thetan ★★★
()
Последнее исправление: Thetan (всего исправлений: 1)
Ответ на: комментарий от monk

Кстати, есть ещё проблема обратной траслитерации. Ivan Smith — это «Айвэн Смит» или «Иван Смит» или «Иван Кузнецов»?

Есть. Дальше что?

Thetan ★★★
()

Звонит Сергей Кужугетович Владимиру Владимировичу и говорит: к нам летят томагавки. Вышлите координаты целей для ответного удара на E-mail. Владимир Владимирович: а напомните ваш E-mail, у меня под рукой нет записной книжки. Ш как w? или как sh? C как русское или как доллар? И т.п. Пока происходит этот разговор, томагавки как раз успеют долететь. Это, конечно, рассказ метафорический. Но любая попытка продиктовать E-mail занимает в России много времени, а люди иногда бывают очень дорогостоящие. И каждый такой раз мы немножечко-немножечко увеличиваем своё отставание от США. А мог бы Сергей Кужугетович сказать: пишите на ФИО по Яролиту.

годнота!

conalex ★★★
()
Ответ на: комментарий от conalex

ну и англоговорящим нэйтив-спикерам тоже часто приходится сталкиваться с именами с неочевидным написанием и произношением

Harald ★★★★★
()
Ответ на: комментарий от Thetan

Между прочим, в большинстве языков Европы это «й», а в испанском «х».

Вот именно. Поэтому узнав фамилию человека, даже не определишь на какую букву его в адресной книге искать. И наоборот, наткнувшись на имя, не узнаешь, как его произносить, пока не определишься с национальностью носителя этого имени.

Например «Хуан» — это Juan или Huang? «Жан» - это Zhang или Jean или Zhan или Jan? Поэтому «please spell your name» - крайне распространённая просьба.

Фактически, в англоязычных странах имя эдакий иероглиф, требующий запоминания целиком и мало связанный с произношением.

monk ★★★★★
()
Последнее исправление: monk (всего исправлений: 2)
Ответ на: комментарий от Harald

Ты знаешь такое понятие «метафора»?

den73 ★★★★★
() автор топика
Ответ на: комментарий от Harald

Значит, мы можем их в этом опередить. Наш язык читается гораздо лучше. Надо это сделать.

den73 ★★★★★
() автор топика
Ответ на: комментарий от Harald

чего это ты такой серьезный сегодня?

цели целями. а если им нужно о рыбалке договориться не увеличивая при этом отставание от США?

conalex ★★★
()
Ответ на: комментарий от conalex

Суммарное отставание от США складывается из микро-отставаний по каждой элементарной бизнес-операции. Иметь уродливую письменность или переключать раскладку клавиатуры - это то, что может создать огромное отставание (как и наличие многих письменностей, или необходимость во взрослом возрасте учить чужой язык для профессии, когда голова варит уже не так быстро как в детстве). Поэтому в России ИТ должно быть на русском.

den73 ★★★★★
() автор топика
Ответ на: комментарий от Thetan

Имеет значение не моё восприятие, а сам твой поступок. Давай ссылку на второе оскорбление, чтоб два раза не ходить :)

den73 ★★★★★
() автор топика
Ответ на: комментарий от bodqhrohro_promo

Осилил ещё три строчки из википедии. Оказывается, у этого стандарта есть и другие названия ЛОЛ

ISO/R 9 (1968), ГОСТ 16876-71, СТ СЭВ 1362-78, ООН (1987)

СЭВ неважен, ООН я не понял что (номера документа нет). Теперь надо найти ISO/R 9 и разобраться, что сие есть.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

А ты сам тут объяснить не можешь, без сомнительных ссылок на какую-то ерунду, которую ты сам же туда и запостил?

На свои авторские источники никто не ссылается

djambeyshik ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.