LINUX.ORG.RU
ФорумTalks

Новая версия Яролита (форк ГОСТ 16876-71, табл 2)

 , ,


0

2

Выпущена новая версия яролита. Она почти равна русскому подмножеству ГОСТ 16876-71 (ISO/R 9:1968) (так случайно получилось).

V chashhakh juga zhil by citrus? Da, no falqshivyjj ehkzempljar!

Отличия от ГОСТ:

ь = q (перевернули мягкий знак)
ъ = jq (твёрдый знак разрезали и перевернули)
† = j8224j // любой юникод тоже представим
// Переключение языка с помощью последовательности
Ajj da xesukin xrsyn
// Добавлены дореформенные буквы (но их выкину в пользу братских и "небратских")
http://программирование-по-русски.рф/яролит.яргт/

Дальше изучаем тему. Буду складывать сюда всё, что найду:

http://meganorm.ru/Data2/1/4294835/4294835719.pdf - ГОСТ (ныне упразднён)

https://www.iso.org/standard/3587.html - история

https://www.ub2000.de/ru/kachestvo-perevodov/zaverennye-perevody-soglasno-sta... - пример использования (некоторые организации в германии требуют перевод по этому стандарту)

http://userscripts-mirror.org/scripts/review/89883 - кодировщик на JS для 1968 - неправильный, т.к. в нём й = j, а должно быть jj.

★★★★★

Последнее исправление: den73 (всего исправлений: 7)

Ответ на: комментарий от den73

Ты наслушался антисоветской пропаганды.

Нет, я хочу послушать несмешные шутки очередного клоуна местного аншлага. Так что ты продолжай.

Изучи историю чуть лучше и выяснится, что навязывание иной письменности - это один из инструментов доминирования, которые давно известны всем.

Что сказать-то хотел?

Thetan ★★★
()
Ответ на: комментарий от Thetan

Я в Китае и иже с ними абсолютно ничего не понимаю. Но вообще темп жизни ускоряется. В условиях, когда начинает бороться за место под солнцем Китай и, скажем, Европа, может оказаться, что китайская письменность слишком дорого обходится стране. В этом случае власть проводит реформу. Моё личное ИМХО - иероглифы это круто, но такая письменность эффективна, если их не больше 1000 и они стандартизованы (нельзя придумать новых). Хотя опять же, зависит от цели. Письменность может быть шифром только для своих, в этом случае трудность её изучения может укреплять сословные привилегии или определять границы кланов. А когда расклад поменяется, она может стать обузой для доминирующего сословия.

den73 ★★★★★
() автор топика
Ответ на: комментарий от Thetan

Что сказать-то хотел?

Вышла новая версия Яролита.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от Thetan

Ну во Вьетнаме иероглифы не были так уж сильно распространены, чтобы говорить о смене письменности.

???

Вообще-то, 600 лет она была единственная во Вьетнаме.

В Корее, по крайней мере Южной, от иероглифов отказались постепенно в течение десяти, что ли, лет.

Любая реформа письменности постепенна. Даже если это реформа орфографии.

Про КНР согласен. Хотя реформа орфографии, при которой слова начинают писаться другими знаками, тоже является сменой письменности.

Все эти реформы (+ советская) имели одну цель: чтобы умение читать стало массовым.

monk ★★★★★
()
Ответ на: комментарий от den73

Чо там думать? ї — ji, є — je, ґ — jg, ў — ww, ѐ — we, ђ — jd, ѓ — wg, ѕ — ws, ј — wy, ћ — jc, ќ — jk, ѝ — wi, џ — wd, ғ — gh, қ — wk, ң — wn, ү — uh, ұ — wu, ә — ah, ө — oh. Вот на всякие малые народы РФ красивых диграфов уже не хватит, да.

bodqhrohro_promo
()
Ответ на: комментарий от bodqhrohro_promo

Фигасе ты шустрый! А ты можешь проверить это на ком-нибудь? Я мову не размовляю, желательно, чтобы транслит был понятным. Я сейчас, конечно, лингвисту напишу, но его предки с Донбасса, так что ХЗ, чем это закончится :)

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Моё личное ИМХО - иероглифы это круто, но такая письменность эффективна, если их не больше 1000 и они стандартизованы (нельзя придумать новых).

Даже западный человек использует больше: в юникоде 800 математических символов и стрелок (страницы 2190-22FF) + 256 технических символов (23**) + эмодзи, иконки, дорожные знаки, ...

Иероглифы для письменности удобны скоростью чтения. Текст визуально занимает в два раза меньше места и в 3 раза быстрее читается.

Изучать слова с иероглифами или без — примерно одинаково. В любом случае приходится запоминать правильное написание слова. С иероглифами трудность только первое время, пока не научишься разбивать их на базовые элементы.

Единственный объективный недостаток: если натыкаешься на незнакомое слово, не знаешь как оно произносится.

monk ★★★★★
()
Ответ на: комментарий от monk

Я бы не стал считать стрелки в юникоде элементами письменности - они всё же никак не стандартизированы и их смысл контекстно-зависим. В целом мысль интересная.

den73 ★★★★★
() автор топика
Ответ на: комментарий от bodqhrohro_promo

Блин, меня и так скоро уже c двух работ выгонят из-за этого транслита. Ты можешь как-то интегрировать (хаха, самому смешно) и предложить то, что будет не совсем ужасным. Яролит я долго вылизывал, в нём всё проверено на нескольких хотя бы людях. Т.е. чтобы это был консенсус не всех носителей УЯ, но хотя бы чтобы хоть кто-то это признал за осмысленное.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Т.е. я имею в виду, это ты назначил с учётом звучания, или только исходя из наличия доступных значков? ИЛи это ты откуда-то взял в готовом виде?

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от den73

c двух работ выгонят из-за этого транслита

То есть ты и в оффлайне поехавший? Это редкость, пожалуй.

чтобы хоть кто-то это признал за осмысленное

А вот это можно и обсудить.

bodqhrohro_promo
()
Ответ на: комментарий от bodqhrohro_promo

Нет, я просто специалист по редкой технологии, гений в процессе карьерной трансформации с сильной приверженностью к хоббийным проектам.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Точнее, мог бы стать гением, но закопал свой талант в землю.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Прям на ходу, из доступных значков и с определённой системой (w предпочтительно на буквы, где есть черта сверху или крючочек). И вот думаю, не опрометчиво ли я ww зарезервировал — под расширение до триграфов и далее в итоге остаётся только h[h]+, ну и [j]+w/[w]+j, допустим.

bodqhrohro_promo
()
Последнее исправление: bodqhrohro_promo (всего исправлений: 1)
Ответ на: комментарий от monk

Вообще-то, 600 лет она была единственная во Вьетнаме.

Я про массовость. Хотя у меня недостаточно знаний по этой теме, но вроде грамотных вьетнамцев был небольшой процент.

Любая реформа письменности постепенна.

В сталинском СССР не церемонились. Туркменбаши тоже не церемонился. Хотя можно и надорваться, что продемонстрировал Узбекистан.

Thetan ★★★
()
Ответ на: комментарий от bodqhrohro_promo

Про ww не понял, я не так быстро соображаю. Не понял, почему именно это может повлиять. А откуда столько значков вообще? Я вижу в украинском алфавите только 4 отличающихся от русского, а у тебя их тут 20.

den73 ★★★★★
() автор топика
Ответ на: комментарий от bodqhrohro_promo

Ты и правда думаешь, что я псих? Успокойся уже :) Я не понял, битбукет всё что ли? Короче, когда надумаешь, как оно должно быть, шли PR, файл вот такой: https://bitbucket.org/budden/ppr/src/master/pages/яролит.яргт.vue?at=master

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 3)
Ответ на: комментарий от bodqhrohro_promo

Впрочем, почитал, чо у тебя за проект — с украинскими националистами такое точно обсуждать не нужно ;-) Лучше с донбассчанином своим обсуждай.

А

печатаем Rus+Lat без боли

вообще непонятно на фига нужно, у меня именно что без боли — на LShift Eng, на RShift Rus, на RAlt Ukr. А раскладки с двумя алфавитами кряду ниновижу ещё с нокий, где язык ввода переключается через жопу даже в последних версиях S40, зато можно вводить латиницу минимум в 4-5 нажатий на букву через кириллицу и цифру, ога. Вон в украинской раскладке тоже русские буковы как бы на Third Row (прямой аналог ЯроКлавы) есть, но оно неюзабельно для активного использования.

bodqhrohro_promo
()
Ответ на: комментарий от bodqhrohro_promo

Я в шоке. Да тебе орден надо. Но всё же давай, недельку ночами поворочайся. Надо выдавать качество. На такой случай ww не жалко, даже если с триграфами потом станет туго (хотя я не пойму), j<любая-не-использованая-для-диграфа-буква><любая-буква> - разве это не запас триграфов? Соответственно, вместо j можно взять w и Или ты все такие уже истратил? Вроде не должен был. И ещё я подумаю о целесообразности казахских - они ведь решили переходить на латиницу, и что мы своим транслитом тут изменим? Меня и в России уже заклевали, вряд ли кто-то будет пользоваться, кроме меня самого, а тут против воли суверенного государства идти.

den73 ★★★★★
() автор топика
Ответ на: комментарий от bodqhrohro_promo

Я очень надеюсь, что это жалкое убожество, одобренное старым маразматиком, не примут...

...а вместо неё примут нормальную латиницу на основе турецкой.

Thetan ★★★
()
Ответ на: комментарий от bodqhrohro_promo

Блин, ща опять за нацпол порежут.

у меня именно что без боли — на LShift Eng, на RShift Rus, на RAlt Ukr.

Это отдельная тема, давай в другой раз. Пипец реально мне настанет вот вот.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

<любая-не-использованая-для-диграфа-буква>

Ну с таким подходом запаса много, но тогда немного теряется позиционность и усложняется парсинг. Ты уже не можешь просто захватывать буквы по токенам j*, w* и *[h]+. А это особенно важно, если, например, нужно быстро посчитать, сколько букв это будет в кириллице, не конвертируя в неё.

и что мы своим транслитом тут изменим

Ваще ничего. Проблемы техномартышек в подобных политических вопросах играют далеко не первую роль.

bodqhrohro_promo
()
Ответ на: комментарий от bodqhrohro_promo

Т.е. ты предполагаешь драгоценные диграфы отнести на алтарь паневразийства? Или ты просто переводчик с казахского на украинский?

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Осталось дождаться, пока Сорос озадачится провести рекламную кампанию в рядах депутатов Госдумы и с кириллицей будет покончено

Современные потуги транслитерации имеют гораздо более прозаичные причины.

Тебе в банке на карте транслитерировали твоё имя одним способом, а в загране - другим. И у тебя потенциально куча проблем из-за пары букв разницы, если вдруг что случится. Хотя понятно что и карта и паспорт по отдельности работать будут.

sergej ★★★★★
()
Ответ на: комментарий от den73

Ну скорее ранжирую по количеству — украинцев, сербов, болгар и казахов много. Хотя тогда и татар с чеченами хотя бы учесть стоит.

bodqhrohro_promo
()
Ответ на: комментарий от den73

И если ты ставишь задачу именно для технического применения во всякой учётной сфере, то тут явно стоит смотреть по критерию суверенности — у всяких чучмеков типа эвенов и якутов всё равно уже есть российский паспорт с версией имени на русской кириллице.

bodqhrohro_promo
()
Ответ на: комментарий от bodqhrohro_promo

Я слёту не пойму, в чём разница. В любом случае есть FSM, управляемая несколькими таблицами размером 36. По-моему, всё в любом случае будет линейно по скорости. И регэкспы твои тоже образуют FSM, просто другую. Мне кажется, однохренственно.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от bodqhrohro_promo

Скоро задача дойдёт до неразрешимой.

den73 ★★★★★
() автор топика
Ответ на: комментарий от sergej

Эту проблему не решает даже сабж, даже наоборот — усугубляет. Вот у нас ещё в районе 2010-го приняли окончательно законодательно утверждённый вариант транслитерации, отмёвший срачи вокруг г => g|h, я => ya/ia|ia|ya и подобного. А воз и ныне там.

bodqhrohro_promo
()
Ответ на: комментарий от bodqhrohro_promo

Где у нас? На(в) Украине? В России нет, кодировка загранпаспорта менялась с тех пор раза два-три.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Ладно, верю, я-то парсеров толком никогда не писал, только клеточными автоматами, грамматиками да бизоном в универе баловался ;-)

bodqhrohro_promo
()
Ответ на: комментарий от den73

Канешн, я ж хохол. И меня сие весьма касается, аж три раза (и в Ф г, и в И г, и в О йо). Ну по крайней мере, есть куда носом тыкать, если кто-то опять нарукожопит. А вы страдайте :D

bodqhrohro_promo
()
Ответ на: комментарий от Thetan

Вот, собственно, нашёл проект обратимой латиницы.

Угу, но мой лучше. Более привычен к фонетике, ь = q (перевернуть, визуально хорошо, а у них q = ч, тоже визуально, но ч реже и уже имеет привычное начентание в виде ch, а для мягкого знака привычного начертания нет, и попробуйте придумтаь что-нибуьд лучше, чем q), y потрачен на частое ы вместо редкого ю, и в запасе остались x и w, что позволяет добавить ещё кучу возможностей. На самом-то деле, если до государства не донести мысль о том, что нужен стандарт и всех заставить следовать ему, то каждый будет делать свой транслит на коленке. Не так уж важно, какой стандарт принять, важнее то, чтобы какой-то начал доминировать. Желательно, конечно, более совершенный.

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от den73

Во всяком случае, если обратимые транслиты зажигают, то это кому-нибудь нужно.

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Тогда пусть лучше победит BGN/PCGN. Из-за распространённости англояза и привычности его орфографии для большинства населения это будет лучший вариант. Да, люди ведь привыкли к Й = Y, (Ч, Ш, Щ, Ж) = (CH, SH, SCH, ZH) и прочим вещам.

Хотя есть и куча баранов, которые пишут «arbyz», «kykyryza»...

Thetan ★★★
()
Ответ на: комментарий от bodqhrohro_promo

Да я не знаю, подумаю на досуге. Жду PR, короче. Там код дуболомно простой и только в одну сторону. Нда, почитал про татарский язык и аж плохо стало. Кириллицу со всех сторон подъедают :(

den73 ★★★★★
() автор топика
Ответ на: комментарий от Thetan

Говно твой английский. У него вообще с фонетикой плохо. Просто янки всем сели на голову. Сейчас опять нацпол начнётся :(

den73 ★★★★★
() автор топика
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от bodqhrohro_promo

Помню, лет 15 назад играл на карте cs_bbicotka в каэске. Не мог понять, что это за ббикотка такая, оказалась BbICOTKA.

Thetan ★★★
()
Ответ на: комментарий от Thetan

люди ведь привыкли к Й = Y,

ПОсмотрел на BGN/PCGN, слава богу, что наша страна нашла в себе силы седлать я = ia и т.п., а не ya. Но я просто не знаю, как можно это обсуждать без политики. По-немецки ja, я так и сделал. Немецкий тоже не фонтан, но лучше английского (вроде там более-менее по тексту можно определить, как он читается).

den73 ★★★★★
() автор топика
Ответ на: комментарий от den73

Ого, оказывается, яролит - это почти что точно ГОСТ 16876-71, таблица 2, просто сделан обратимым в рамках букв. Отличаются только ь и ъ.

den73 ★★★★★
() автор топика
Ответ на: комментарий от bodqhrohro_promo

Где в турецком ө?

Иди поспи, АТО совсем невнимательный стал.

қ/ң

Oñtüstik Qazaqstan. Ñ притащили крымские татары, Q азербайджанцы. Хотя қ и ғ по большому счёту не нужны, звучание К и Г зависит только от ряда гласных. Киргизы прекрасно живут без этих букв (Кыргызстан читается как Қырғызстан).

Будто у казахского с турецким настолько много общего

Во всех тюркских много общего.

Thetan ★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.