LINUX.ORG.RU
решено ФорумTalks

Кириллатиница

 


1

1

Продолжаем мозговой штурм по переводу кода на русский язык и восстановлению позиций кириллицы в ИТ. С Кои-7 идея, ясное дело, плоха отсутствием латиницы. Но её можно развивать в разных направлениях, чтобы латиница появилась.

Последняя идея, к-рая пришла в голову - следующая. Иногда нам не так уж важно, написан ли текст в кириллице или латинице. В этом случае мы просто возьмём да и добавим в кириллицу недостающие буквы из латиницы. А те, которые пересекаются, будем считать идентичными и присвоим им общий код. При идентификации будем использовать яролит взад, цитирую:

    a b c d e f g h i j k l m n o p q r s t u v w x y z
    а б ц д е ф г ш и й к л м н о п ь р с т у в ю х ы з

Но не весь, а часть букв выкинем (по ходу дела разберёмся, какие). Тут сразу есть проблема с b и p, которые при одинаковом написании имеет разные смыслы. Но на первый взгляд алфавит для представления латиницы получается такой:

a б ц д э ф г h i j к л м н о п q r s т u в w х y з

Итого мы добавили h i j q r s u w - всего 8 букв. Вся кириллица остаётся на месте, итого получается:

а б в w г д е ё ж з и i й j к л м н о п q р r с s т у u ф х ц ч ш h щ ъ ы ь э ю я

Протестируем:

Возьмём, например, произвольный текст из «Авторевю»

    Ездит на автомобилях Mitsubishi Lancer Evolution IX и ГАЗ-21Р

Текст набран одним шрифтом. На кириллатинице он будет выглядеть так:

    Ездит на автомобилях Мiтsuбishi Ланцеr Эволuтioн IХ и ГАЗ-21Р. 

Уффф. Хрень какая-то. Но на то и мозговой штурм, чтобы обсуждать хрень.

Плюсами является:

  • если впихнуть кириллатиницу в одну раскладку, будет гораздо удобнее печатать. Перевод с английского на русский такой масштабной вещи, как ОС, может быть только поэтапным, поэтому длительное время останется необходимость постоянно переключаться. Эта необходимость очень неприятна.
  • некоторые мнемоники (MOV какой-нибудь или ls) вообще вряд ли имеет смысл переводить. Поэтому, если не сделать единую раскладку, неудобство сохранится навсегда. Если же применить кириллатиницу и единую раскладку, то будет лучше.
  • если совпадающие буквы поместить в ASЦII, возникнет неявная кириллизация исходных текстов. Хотя предикат isАлпha станет сложнее. Но эта сложность коснётся только новых идентификаторов, содержащих непересекающиеся с латиницей буквы

Минусы:

  • для случаев, когда нам нужна именно латиница, придётся отвести отдельные коды букв и изменённые начертания. В Uнiцодэ вряд ли найдётся для них место, хотя я ХЗ. Но это не только минус, но и плюс. Т.к. проблема совпадения начертаний некоторых кириллических и латинских букв достаточно актуальна и всё равно то, что в шрифтах они пишутся одинаков - это баг современных шрифтов
  • не совсем ясно, как осуществлять поиск. По идее, поиск по кириллатинице может происходить так:
    • если по слову «жук» ясно, что это кириллица, ищем в кириллице
    • если по слову «worд» ясно, что латиница, ищем в латинице
    • слово «мама» ищем два раза (мама и mama)
    • слово «wой» ищем как слово в кириллатинице - не русское и не английское ,

Перемещено leave из development

★★★★★

но ведь чтобы писать на кириллатинице надо быть поехавшим, как так?

Anoxemian ★★★★★ ()

представил, что все стали переводить софт на грузиницу, китаицу, японицу, аряминицу и так далее… представляете программу на китаице?

alysnix ()

Предлагаю переименовать в киритиницу, чтобы сразу было понятно, кто ей занимается xD

knd ()
Ответ на: комментарий от Anoxemian

Таким алфавитом писали румыны в середине XIX века. Но и линукса тогда не было.

gedisdone ★★★ ()
h <-->ш

Это что за поехавший придумал? Ш – это дубль-вэ, очевино же.

kostyarin_ ★★ ()

Шла вторая неделя карантина. Крыша съехала ещё несколько дней назад, кукуха тоже не заставила себя долго ждать.

gremlin_the_red ★★★ ()

Может пора уже перейти на КОИ-8?

anonymous ()
Ответ на: комментарий от Anoxemian

но ведь чтобы писать на кириллатинице надо быть поехавшим, как так?

Ⱅ ⰺⱄⱅⰺⱀⱆ ⰳⰾⰰⰳⱁⰾⰺⱎⱐ ⱄⱀ ⰿⱁ.

kostyarin_ ★★ ()

Для чего это нужно?

anonymous ()
Ответ на: комментарий от anonymous

Для перевода исходников A2 на русский язык. Никто ведь не возражает против перевода сказок братьев Гримм или Шекспира? При этом ввиду низкобюджетности и размазанности типов «строка» по всему исходнику, сложно сразу везде сделать, чтобы кириллица работала. Это стандартная и известная техническая проблема. Перевод программы - сложнее, чем перевод просто книжки.

den73 ★★★★★ ()
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от anonymous

Это неэкономная кодировка. Она включает в себя кучу лишних буков, не нужных нормальному русскому человеку. АСЦИИ куда разумней, выкинуть оттуда латинницу, вставить кириллицу и можно экономить один бит из 8, т.е. передача данных будет на 12.5% экономней.

Я бы ещё предложил сделать отдельную казахскую кодировку и писать программы на казахском языке. На мой взгляд он больше подходит для языка программирования, более выразителен и интересен.

Legioner ★★★★★ ()
Последнее исправление: Legioner (всего исправлений: 1)
Ответ на: комментарий от Legioner

Нормальный русский человек, а особенно iт-шник, уже давно фактически двухъязычный, если ты этого ещё не заметил, Легiонэr.

den73 ★★★★★ ()
Ответ на: комментарий от den73

Это всё преходяще. Было время, французский учили, сейчас английский, через сто лет может греческий будут учить. А Русский Язык был, есть и будет есть.

Legioner ★★★★★ ()

Какую неделю на самоизоляции?

Qwentor ★★★★★ ()
Ответ на: комментарий от den73

Стихи не переводятся, Шекспира не на английском нет, Пастернак и есть Пастернак.

anonymous ()
Ответ на: комментарий от anonymous

Так можно и про прозу сказать. В общем-то всё верно, но это пижонство.

А вообще я не понимаю причем здесь переводы. Если автор треда хочет русский язык программирования, так это совсем другая история. 1С вон есть без всякого смешения русских букв с латинскими.

anonymous ()
Ответ на: комментарий от Legioner

Ещё Карл 5 говорил «По испански я говорю с Богом, на итальянском с женой, на французском с любовницей, на немецком с лошадью, на алуму-тесу с компьютером».

gremlin_the_red ★★★ ()
Ответ на: комментарий от anonymous

Переводы при том, что это хобби-проект. Нет ресурсов делать язык и ОС на русском языке. Перевести уже существующее гораздо проще. Как басни Крылова. Он их частично сам придумал, частично перевёл с разной степенью переработки. В культуре все новые произведения возникают именно так. Делать с нуля на русском языке - это велосипедостроительство и НIХ-синдром. Кстати, с заглавными буквами отдельная беда.

den73 ★★★★★ ()
Ответ на: комментарий от gremlin_the_red

Ну и нахрен нужно портить свой мозг изучением множества языков, когда достаточно выучить 2-3 и остальное время потратить на дело? У королей своя специфика (как и дворян вообще), для них профессионально необходимо быть полиглотами. При том бьюсь об заклад, что и Тургенев плохо знал свои 20 языков, хотя был дворянином и ему не нужно было впахивать ради хлеба насущного.

den73 ★★★★★ ()
Ответ на: комментарий от gremlin_the_red

Шла вторая неделя карантина. Крыша съехала ещё несколько дней назад

Так это ж ДЕН73! Ему и карантин не нужен для этого.

Tanger ★★★★★ ()
Ответ на: комментарий от Legioner

+1. Надо обнулить стандарты - covid19 же!

anonymous ()
Ответ на: комментарий от anonymous

Да ни в чем. Вообще, унификация это отлично, потому что помогает людям понимать друг друга.

В литературе и устной речи это имеет побочный эффект: снижение культурного разнообразия. Поэтому в идеале в каждой стране должен быть свой и плюс один общий для всех.

В ЯП культурное разнообразие тоже есть, но оно существует не за счет использования русских/английских слов, а за счет логики. Бэйсик, С++ и Хаскель - это разные языки с разной культурой.

Пытаться же создать ЯП с русскими словами - это примерно как ввести собственную систему мер. Никаких профитов нет, одни проблемы. Впрочем, США вот такой хнернёй страдают. (Но у них отмазка, типа перевод все на международную систему будет дорого стоить.)

Автор просто большой патриот, вот и страдает.

anonymous ()
Ответ на: комментарий от anonymous

Кстати, что там с таблицей Менделеева?

anonymous ()
Ответ на: комментарий от den73

не с того ты начал, сейчас для новичков нужны актуальные маны на русском, а то тут выяснилось, что даже в убунте их давно уже нет

anonymous ()
Ответ на: комментарий от anonymous

Скучную работу работать никто не хочет.

anonymous ()
Ответ на: комментарий от anonymous

Патриот — тот, кто любит свою страну и желает ей добра. ТС же ненавидит русское ИТ и хочет его уничтожить.

gremlin_the_red ★★★ ()
Ответ на: комментарий от anonymous

Китайцы вот осилили перевод на родной язык. Просто вместо этого велосипеда достаточно макрос вткнуть, который будет в исходниках команды переводить на инглишатский. Недостающие символы ставятся ра функциональный клавиши. Таким образом удастся полностью избавиться от инглишезависимости. Склонять ничего в сокращениях нет надобности, что упрощает написание с комментированием. Цель тут ясна - сделать англишатников двуязычными, если им хочется исходники почитать. Профит как выясняли будет около +30% эффективности работы программиста.

anonymous ()

a б ц д э ф г h i j к л м н о п q r s т u в w х y з

А теперь напиши этим скажем «мышь пьет коктейль».

ya-betmen ★★★★★ ()
Ответ на: комментарий от gremlin_the_red

Нет, ну может он хочет чтоб все в избах жили, в каждой избе Эльбрус, под вечер на балайке побрыньгаешь и идешь кодить на русском языке программирования.

anonymous ()
Ответ на: комментарий от anonymous

Цель тут ясна - сделать англишатников двуязычными, если им хочется исходники почитать.

не получится, ибо они сделают автоматический переводчик-англификатор

anonymous ()
Ответ на: комментарий от anonymous

почему сразу скучную? во время перевода манов можно и самому что-то интересное из них узнать

anonymous ()
Ответ на: комментарий от ya-betmen

А теперь напиши этим скажем «мышь пьет коктейль».

Обвiousлy, «мышь пьет коктейль».

den73 ★★★★★ ()

восстановлению позиций кириллицы в ИТ

есть что восстанавливать?

Продолжаем

я много пропустил видимо

Deleted ()

Ваши изыскания похожи на «Слышал звон, да не знает где он».
Ответьте на следующие вопросы и будет понятно в чем проблема:

 - В грамматиках языков программирования учитывается возможность написания идентификаторов в нескольких кодировках?

 - Почему возникают коллизии в грамматиках?

Владимир

anonymous ()
Ответ на: комментарий от anonymous

Не очень понял, т.е. вообще ничего не понял. Есть ли ссылка на замеры эффективности работы программиста? Есть ли примеры кода на китайском? Я искал, но ничего толком не нашёл.

Касаемо цели сделать англишатников двухязычными, любая нормальная цивилизация стремится сама говорить на своём языке и навязывать его другим. Просто в России 5-я колонна победила и Россия по сути дела как цивилизация умирает. Признаком этого является то, что тема кириллицы в ИТ интересна, так скажем, десятку маргиналов. Но лучше сюда не углубляться, а то уже политика пошла и тему могут стереть.

Китайцам пофигу на конкретно англишатников. Они просто почувствовали свою силу и теперь будут всем иностранным обезьянам навязывать свою культуру и свой язык. Это процесс не быстрый, т.к. китайцы вообще не спешат. Но мы это в течение, думаю, 5-10 лет так заметим, что мало не покажется.

den73 ★★★★★ ()
Последнее исправление: den73 (всего исправлений: 2)

Думаю лучше опираться на статистику, чтобы можно было более менее однозначно определять принадлежность слова-фразы к конкретному языку. Наиболее частые буквы должны быть уникальны в алфавите (как первое приближение, буквы центра клавиатуры), а редкие (переферия) - можно совмещать даже приполном несовпадении начертаний (редкие ошибки мозг «носителя языка» автоматом исправит).

anonymous ()
Ответ на: комментарий от anonymous

Думаю лучше опираться на статистику, чтобы можно было более менее однозначно определять принадлежность слова-фразы к конкретному языку. Наиболее частые буквы должны быть уникальны в алфавите (как первое приближение, буквы центра клавиатуры), а редкие (переферия) - можно совмещать даже приполном несовпадении начертаний (редкие ошибки мозг «носителя языка» автоматом исправит).

Не понял твою мысль.

den73 ★★★★★ ()
Ответ на: комментарий от anonymous

Ответьте на следующие вопросы и будет понятно в чем проблема:

  • В грамматиках языков программирования учитывается возможность >написания идентификаторов в нескольких кодировках?

  • Почему возникают коллизии в грамматиках? Владимир

Не хочу отвечать, т.к. неясно, при чём тут это вообще. Речь про алфавит, про лексику, а не про грамматику. И не надо мне загадок, у меня их хватает. Если есть конкретная мысль - напишите.

den73 ★★★★★ ()
Последнее исправление: den73 (всего исправлений: 1)
Ответ на: комментарий от anonymous

даже в убунте

а убунта это типа мера вещей?

Deleted ()
Ответ на: комментарий от den73

Речь про алфавит, про лексику, а не про грамматику.

Правильно ли понял о том, что речь идет об использовании кириллицы при написании текста программ?

Владимир

anonymous ()
Ответ на: комментарий от anonymous

Речь не столько об этом, сколько о том, как оптимальным образом осуществить переход на кириллицу для уже существующей ОС на миллион строк любительскими силами.

den73 ★★★★★ ()
Ответ на: комментарий от den73

Первое приближение.

Берешь клавиатуру. Центральный квадрат rtyu-fghj-vbnm кенг-апро-мить оставляешь как есть. А остальные буквы можно совмещать, вплоть до того что Q будет означать Й.

anonymous ()
Ответ на: комментарий от den73

… о том, как оптимальным образом осуществить переход на кириллицу для уже существующей ОС на миллион строк любительскими силами.

Что именно в ОС перевести на кириллицу?

Владимир

anonymous ()
Ответ на: комментарий от anonymous

Что именно в ОС перевести на кириллицу?

Если к примеру хотим имена программ, утилит, … называть русскими именами, то много чего править нужно будет в исходниках ОС.

Владимир

anonymous ()
Ответ на: комментарий от anonymous

Если к примеру хотим имена программ, утилит, … называть русскими именами, то много чего править нужно будет в исходниках ОС.

Что касаемо использования кириллицы в исходных текстах программ, то об этом сказано выше.

Владимир

anonymous ()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)