CP1251 - латиница вместо кириллицы

0

1

Ubuntu 20. Имеется ПО, являющееся тяжким наследием windows-платформы: LabView и порождаемые им исполняемые файлы. Сейчас исследую его переносимость на linux. Изначально тексты там хранятся в 1251 кодовой странице. При запуске в linux напрямую все русские буквы пропадают (т.к. здесь оно работает в utf-8). Добавил локаль ru_RU.CP1251, запускаю программу через LC_ALL=ru_RU.CP1251 ./software Пропавшие символы возвращаются, но вместо кириллицы - латинские символы с умлаунтами и т.п. Такое ощущение, что вместо 1251 страницы реально оно работает в Latin-1. Есть ли возможность подкрутить что-то со стороны системы? Для windows находил советы 15-летней давности на тему подстановки шрифтов с правкой реестра. А здесь можно что-то сделать? Спасибо.

Ссылка

← Помогите пожалуйста с bluetooth

отправлять сообщения из telegram в syslog →

Отпиши пожалуйста если найдешь ответ где нибудь в другом месте.

~~MOPKOBKA~~ ★★★★★
(28.05.21 11:31:05 MSK)

Ссылка

Уточнять надо детали, тут не все знают что такое LabView и где оно пишет тексты. Это вывод в терминал? Или это нативное X11-приложение? Или это скрипты для какого-то гуи интерпретатора? Или это запуск win32-проги через wine?

firkax ★★★★★
(28.05.21 11:47:07 MSK)

Ответ на: комментарий от firkax 28.05.21 11:47:07 MSK

Это нативное графическое приложение.

varrax
(28.05.21 12:00:06 MSK) автор топика

Ответ на: комментарий от varrax 28.05.21 12:00:06 MSK

Что тогда значит «переносимость на линукс» если оно и так нативное?

Где хранятся «тексты»? Может их сконвертировать?

firkax ★★★★★
(28.05.21 12:04:21 MSK)
Последнее исправление: firkax 28.05.21 12:05:12 MSK (всего исправлений: 1)

метапрог приди, тут у тебя друг вендузятик =)

anonymous
(28.05.21 12:08:59 MSK)

Ссылка

https://labviewwiki.org/wiki/LabVIEW_configuration_file/Fonts

оно?

Morin ★★★★★
(28.05.21 12:24:08 MSK)

Ответ на: комментарий от firkax 28.05.21 12:04:21 MSK

Переносимость в данном контексте - из одного исходного кода (графических диаграмм, но это не важно) можно собрать приложение как для Windows, так и для Linux платформы. Тексты прошиты прямо вовнутрь диаграмм. Вопрос их загрузки через подгружаемые ресурсы отдельный и легко не реализуемый.

Чисто технически в Labview есть возможность экспортировать все текстовые ресурсы, а потом импортировать назад (через некое подобие xml), но (вот сюрприз!) импорт utf-8 толком не работает, выдавая ошибки формата на корректных, на мой взгляд, строках.

varrax
(28.05.21 12:38:30 MSK) автор топика

Ответ на: комментарий от Morin 28.05.21 12:24:08 MSK

https://labviewwiki.org/wiki/LabVIEW_configuration_file/Fonts

Увы, не оно. Фонты я могу задавать любые, но все равно остаются умляунты. Разве что тащить (откуда-то) свой собственный фонт с подмененными буквами, но это как-то совсем уже странно будет…

varrax
(28.05.21 12:44:09 MSK) автор топика

Ответ на: комментарий от varrax 28.05.21 12:44:09 MSK

ну тогда только много годичной давности советы, сконвертить все тексты

разбираться без самой вьювы лень

Morin ★★★★★
(28.05.21 13:10:46 MSK)

Ссылка

Ответ на: комментарий от varrax 28.05.21 12:44:09 MSK

Кирилический шрифт пробовал? Не «шрифт с кирилицей в том числе» (юникодный), а именно кирилический с 8-битными кодами символов. Вроде бы в старых версиях винды были типа «Arial Cyr» - это именно отдельный шрифт, а не свойство к Arial.

firkax ★★★★★
(28.05.21 13:10:56 MSK)

Ответ на: комментарий от varrax 28.05.21 12:38:30 MSK

Из-за проблем с кодировками у нас не получилось гонять и компилировать исходники Метапрога на линуксовой версии Лабвью. Мы решаем эту проблему, используя Wine.

А вообще хорошо б доделать Метапрог и перейти уже на него. Метапрог-прототип 42

Что у тебя за софт на лабвью?

~~metaprog~~ ☆
(28.05.21 13:19:09 MSK)

Ответ на: комментарий от firkax 28.05.21 13:10:56 MSK

Да, это тот путь по которому не хотелось идти, но в итоге попробовал и не работает. При установке Arial Cyr просто пустые квадратики вместо кириллицы.

varrax
(28.05.21 13:24:59 MSK) автор топика

Ответ на: комментарий от metaprog 28.05.21 13:19:09 MSK

Управление удаленным устройством по udp, получение данных, DSP-обработка, отображение всяких графиков и т.п.

varrax
(28.05.21 13:27:34 MSK) автор топика

Ссылка

Ответ на: комментарий от varrax 28.05.21 13:24:59 MSK

Ну, раз так то видимо проблема и правда не в шрифте, а в неподхватываемой кодировке. Наверно где-то внутри, при определении кодировки в windows-стиле (т.к. ttf), он не умеет правильно интерпретировать строку вида «ru_RU.CP1251» и берёт latin-1 для всего непонятного.

Как вариант обойти проблему костыльным способом: берём Arial Cyr, патчим его чтобы софт считал его latin-1 шрифтом (видимо где-то в заголовках кодировка указана), а буквы оставляем русские.

firkax ★★★★★
(28.05.21 13:56:24 MSK)

Ответ на: комментарий от firkax 28.05.21 13:56:24 MSK

А пакет ubuntu-restricted-extras доустановить не пробовал? Так, в порядке бреда, ибо там шрифты а-ля форточки с eula.

anonymous
(28.05.21 14:00:11 MSK)

Ссылка

Может у тебя те же проблемы, что и у ~~Eddy_Em~~ - у него недавно в иксах поломался вывод кодировки в koi8-r при правильно выставленной локали Поломалась кодировка после обновления

Если так, попахивает, что тихо и незаметно в линуксе (в иксах) сломали локали, отличные от utf-8

У тебя только Labview так себя ведет или другие программы с cp1251 и вообще не utf8 тоже?

praseodim ★★★★★
(28.05.21 14:17:23 MSK)
Последнее исправление: praseodim 28.05.21 14:18:41 MSK (всего исправлений: 1)

Ссылка

Изменения локали мало. Нужны шрифты в кодировке cp1251 для X11. Точно такая-же проблемма возникает с запуском старых программ в кодировке koi8-r. Пока не доставишь шрифтов с нужной кодировкой - показывает латиницей с умляутами. Xorg вполне понимает шрифты в кодировке cp1251

sigurd ★★★★★
(28.05.21 17:57:24 MSK)

Ответ на: комментарий от sigurd 28.05.21 17:57:24 MSK

Оно ttf шрифты использует, рисует видимо само и в иксы шлёт готовую картинку. Там что xorg-шрифты ни при чём.

firkax ★★★★★
(28.05.21 19:04:22 MSK)

Ссылка

Ответ на: комментарий от metaprog 28.05.21 13:19:09 MSK

Нам идейка пришла. А что, если просто заменить в бинарных лабвьюшных файлах кириллицу транслитом? Для этого размеры структур менять не нужно. W&glqdetx, kone}no, budet stra{no, zato sober$tsq, a tam uve movno prawitx potihonxku ;)

~~mertvoprog~~ ☆
(10.06.21 14:20:08 MSK)

Ответ на: комментарий от firkax 28.05.21 11:47:07 MSK

тут не все знают что такое LabView

Громкий неприличный смех, переходящий в ржание

hobbit ★★★★★
(10.06.21 14:28:09 MSK)

здесь можно что-то сделать?

Обратиться в поддержку LabView не вариант?

fsb4000 ★★★★★
(10.06.21 15:15:03 MSK)

Ответ на: комментарий от fsb4000 10.06.21 15:15:03 MSK

Зачем тогда вообще нужны форумы?

~~mertvoprog~~ ☆
(10.06.21 19:25:49 MSK)

Ответ на: комментарий от mertvoprog 10.06.21 19:25:49 MSK

Странные товарищи пошли по своему пути что и получили то что хотели закопав свою стюардессу что была без этого бага , но не удобного и не выгодного им создателя сами на себя жалуются это ли не успех?

anonymous
(10.06.21 19:32:11 MSK)

Ссылка

Ответ на: комментарий от mertvoprog 10.06.21 14:20:08 MSK

А как отделить простые байты от «текстовых»?

~~MOPKOBKA~~ ★★★★★
(10.06.21 20:13:02 MSK)

Ответ на: комментарий от MOPKOBKA 10.06.21 20:13:02 MSK

Только эвристикой, увы. Искать цепочки из 0x80–0xff, 0x20 и чего там ещё в идентификаторах встречается. Всё, что вокруг — игнорировать. Немногие ложные срабатывания фиксить руками.

Если есть хоть какие-то сведения о формате, то будет сильно проще ;)

~~mertvoprog~~ ☆
(10.06.21 20:44:51 MSK)

Ответ на: комментарий от MOPKOBKA 10.06.21 20:13:02 MSK

Хм, а почему вот Мы поковыряли вікно чату.vi из 12-й версии и видим там вперемешку строки в CP1251 и UTF-8? Это ~~@metaprog~~ к тому моменту уже попытались безуспешно что-то включить для совместимости с линуксовой версией, или так изначально было во всех файлах?

~~mertvoprog~~ ☆
(10.06.21 20:57:29 MSK)

Ссылка

Ответ на: комментарий от MOPKOBKA 10.06.21 20:13:02 MSK

Ну и, в принципе, строки предваряются байтом с длиной. Этого уже достаточно для почти 100%-ного угадывания, только UTF-8 отфильтровывать не забывайте, раз он там есть ;)

~~mertvoprog~~ ☆
(10.06.21 21:07:59 MSK)

Ссылка

Ответ на: комментарий от mertvoprog 10.06.21 20:44:51 MSK

Я находил что то для разбора формата, но вот незадача, оно на LabView %)

~~MOPKOBKA~~ ★★★★★
(10.06.21 21:08:14 MSK)

Ответ на: комментарий от MOPKOBKA 10.06.21 21:08:14 MSK

Я находил что то для разбора формата, но вот незадача, оно на LabView %)

а как же неоспоримое преимущество LabView над «примитивными текстовыми язычками» – «в графических диагармах все очевидно»

anonymous
(10.06.21 21:16:11 MSK)

Ответ на: комментарий от anonymous 10.06.21 21:16:11 MSK

Я не собираюсь его изучать.

~~MOPKOBKA~~ ★★★★★
(10.06.21 21:19:10 MSK)

Ответ на: комментарий от MOPKOBKA 10.06.21 21:19:10 MSK

Логично.

anonymous
(10.06.21 21:23:22 MSK)

Ссылка

Ответ на: комментарий от MOPKOBKA 10.06.21 21:08:14 MSK

Вот, кстати, обдумывание парсера натолкнуло Нас на интересную мысль.

Допустим, стоит задача использовать для n начальных символов более узкий диапазон символов (поскольку мы точно знаем, что в начале некоторых символов быть не может), а дальше диапазон пошире.

В императивных языках с переменными в подобных случаях заводится переменная-флаг: допустим, в начале она isPrefix=true, по достижению определённой точки — будь это третий символ, символ . или любое другое, более сложное условие — выставляем isPrefix=false. Ключевой момент тут в том, что условие может быть сложным и трудновычислимым, и выполнять его на каждой итерации — не комильфо, надо именно запомнить ;)

В функциональных языках для этого прибегают к лютым извращениям; в простейшем случае — так же гонять флаг по каждому вызову рекурсивной функции, обычно просто передавая его, но в некоторый момент поменяв. Либо же по достижению точки передать дальнейшую обработку в другую функцию, что может привести к дублированию кода и нарушению DRY.

Любопытно увидеть реализацию такого алгоритма на Метапроге ;) Для большей конкретики, вот точное условие: в префиксе ищем символы из 0x20|0x2e|0x80–0xff, по достижению 3-го символа или 0x2e — дополняем диапазон 0x41–0x7a, и больше не выполняем эти проверки, а проверяем только одно значение ;) Дерзайте, этот алгоритм в изменённом виде пригодится потом в парсере!

~~mertvoprog~~ ☆
(10.06.21 21:52:18 MSK)