LINUX.ORG.RU

Ответ на: комментарий от Myau

Есть FineReader, но он закрыт и весьма недёшев.

еще есть finereaderonline.com, он бесплатный но ограничен на количество страниц. Пробовал cuneiform+yagf, падает зараза..(

gal78rus
() автор топика
Ответ на: комментарий от gal78rus

Чего нету? tesseract установлен? А его языковые файлы данных? Если всё установлено, то всё там должно быть включая эту опцию выбора языков. Или дистрибутив очень древний и в его репозитории tesseract тех времён, когда в него ещё не успели ничего толком добавить?

saahriktu ★★★★★
()
Ответ на: комментарий от saahriktu

Чего нету? tesseract установлен?

установлен tesseract 3.04.01, ubuntu 16.04. На приведенные вами команды выдает help.

~tesseract --list-langs
List of available languages (3):
osd
equ
eng

gal78rus
() автор топика
Последнее исправление: gal78rus (всего исправлений: 3)
Ответ на: комментарий от gal78rus

Ну, файлы данных русского языка никто софтине не доустановил.

> tesseract --list-langs
List of available languages (2):
rus
eng
> du -csh /usr/share/tessdata/rus*
22M     /usr/share/tessdata/rus
4,0K    /usr/share/tessdata/rus.cube.fold
4,0K    /usr/share/tessdata/rus.cube.lm
892K    /usr/share/tessdata/rus.cube.nn
4,0K    /usr/share/tessdata/rus.cube.params
15M     /usr/share/tessdata/rus.cube.size
6,8M    /usr/share/tessdata/rus.cube.word-freq
16M     /usr/share/tessdata/rus.traineddata
60M     итого
> tesseract --version
tesseract 3.05.00dev
 leptonica-1.72
  libgif 5.1.1 : libjpeg 6b (libjpeg-turbo 1.4.2) : libpng 1.6.18 : libtiff 4.0.6 : zlib 1.2.8

saahriktu ★★★★★
()
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: комментарий от gal78rus

Там ещё зависит от шрифтов и размеров букв. Даже если просто растянуть (с искажениями, ага) картинку, то качество распознавания может резко измениться.

saahriktu ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.