LINUX.ORG.RU

Не удаётся перекодировать текст

 


1

2

запускается софт в screen и с помощью hardcopy в файл записывается весь вывод

вывод может содержать «русский» текст, hardcopy же пишет в 7-bit ASCII, соответственно «русский» текст выглядит как: ?@825B <8@

сам же файл в utf8.

Как перекодировать текст в файле?

iconv?

на самом деле я не понимаю в чем проблема.

cvv ★★★★★ ()

Это не перекодировать, там ошибка в программном коде screen. Вроде, была отдельная ветка, в которой это исправляли.

mky ★★★★★ ()

Как перекодировать текст в файле?

Наверное только писать скрипт, где сопоставлять каждый отдельный символ в файле нужному. Но сам разбор всех этих кракозябр займет много времени.

А этот hardcopy может выводить в stdout, а не сразу в файл?

anonymous ()
Ответ на: комментарий от anonymous

Ну не любят в GNU юникод, не любят. В целом поддержка юникода, конечно, есть, но не везде и не до конца. Однобайтные кодировки в софте от GNU поддерживаются лучше.

saahriktu ★★★★★ ()
Ответ на: комментарий от anonymous

Среднему в вакууме американцу (а большинство разработчиков проекта GNU именно в США), если он пишет и читает на английском языке, вполне достаточно ASCII. Это нам в России ещё и вторую половину кодовой таблицы с кириллицей подавай.

Юникод актуален прежде всего для арабов, китайцев, японцев, индийцев,... и т.д. Европейцы тоже могут находить его удобным.

saahriktu ★★★★★ ()
Ответ на: комментарий от anonymous

Пусть так. Но для 20% тогда не так уж и актуален. А в абсолютных числах это не так уж и мало - это миллионы людей.

Вот скриншот с пруфом, что hardcopy screen'а дампит не в 7-ми битном ASCII, а в однобайтной кодировке (некоторые коды может не совсем корректно обрабатывать, но тем не менее): http://saahriktu.org/tmp/scr1574124658.png

В общем, KOI8-R поддерживается. А UTF-8 - нет.

saahriktu ★★★★★ ()
Ответ на: комментарий от anonymous

Эти 20% пользуются кодом, который или пишут 80% или пишут с учётом этих 80%...

Далеко не всегда. Нет, конечно, можно использовать ряд софтин, в разработке которых принимали участие японцы, китайцы, индусы,... и т.д. (наподобие ядра, библиотек,... и т.д.), но при этом совсем не обязательно вот в свои конкретные проекты добавлять поддержку юникода. Даже если они являются свободным софтом. Это уже кто как хочет.

saahriktu ★★★★★ ()
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: комментарий от saahriktu

скажи это профессору пишущему статью на русском с формулами или даже толстОму с его вкраплениями французского в войне и мире.

deep-purple ★★★★★ ()
Ответ на: комментарий от deep-purple

Профессора свои статьи оформляют в TeX'е. Там для формул достаточно ASCII. А вот русский и французский в одну однобайтную кодировку, да, не уместить. Но не всем это нужно.

saahriktu ★★★★★ ()
Ответ на: комментарий от deep-purple

Поддержка юникода в софте нужна тем, у кого есть юникодные тексты. А, как я уже писал выше, ряду людей вообще достаточно ASCII.

saahriktu ★★★★★ ()
Ответ на: комментарий от saahriktu

Среднему в вакууме американцу (а большинство разработчиков проекта GNU именно в США), если он пишет и читает на английском языке, вполне достаточно ASCII. Это нам в России ещё и вторую половину кодовой таблицы с кириллицей подавай.

Да первые может бы и с радостью юзали всякие красивые таблички линиями из второй половины, но добрая старая европа взяла и испортила там всё :)

vodz ★★★★★ ()
Ответ на: комментарий от kordomnokod

Проникнитесь проблемой https://savannah.gnu.org/bugs/?55138 , в целом unicode в screen работает, а во всяких hardcopy, hardstatus возникают проблемы. Тут вот есть другие ветки https://github.com/amade/screen/tree/encoding-rewrite , в том числе брошеная unicode++, в которой hardcopy вроде бы исправляли. Но, если я правильно понял, там в кишках всё запутано, и исправляя в одном месте, ломается в другом.

mky ★★★★★ ()
Ответ на: комментарий от kordomnokod

Проникнитесь проблемой https://savannah.gnu.org/bugs/?55138 , в целом unicode в screen работает, а во всяких hardcopy, hardstatus возникают проблемы. Тут вот есть другие ветки https://github.com/amade/screen/tree/encoding-rewrite , в том числе брошеная unicode++, в которой hardcopy вроде бы исправляли. Но, если я правильно понял, там в кишках всё запутано, и исправляя в одном месте, ломается в другом.

mky ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.