Выдираю английские субтитры из двд. Локаль KOI8-R. Когда запускаю Gocr (pgm2txt) на распознование текста, он переодически спрашивает значения нераспознаных символов. я их ввожу. Но когда просматриваю результаты, то обнаруживаю что эти символы вставлены в 2-х байтной кодировке! Кто нибудь знает как это пофиксить? Ибо вручную править результат - это нереально. Мне бы хотя бы, что бы он вставлял символы в однобайтной кодировке вставлял! Тогда ispell-ом можно все поправить.
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.
Похожие темы
- Новости GOCR 0.43 (2006)
- Форум Heed help with GOCR (2009)
- Форум Вопрос о русском языке в gocr... (2004)
- Форум кодировка в кодировке (2007)
- Форум Кодировка (2011)