LINUX.ORG.RU

Gocr (pgm2txt) кодировка


0

0

Выдираю английские субтитры из двд. Локаль KOI8-R. Когда запускаю Gocr (pgm2txt) на распознование текста, он переодически спрашивает значения нераспознаных символов. я их ввожу. Но когда просматриваю результаты, то обнаруживаю что эти символы вставлены в 2-х байтной кодировке! Кто нибудь знает как это пофиксить? Ибо вручную править результат - это нереально. Мне бы хотя бы, что бы он вставлял символы в однобайтной кодировке вставлял! Тогда ispell-ом можно все поправить.

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.