LINUX.ORG.RU

Распознавание текста (в десктопных целях)

 , , , ,


0

2

Что лучше использовать для распознавания текста в десктопных целях(то есть, не распознавание картиночного спама в МТА, и для других применений на сервере)? FineReader под Wine, или tesseract, cuneiform?

cuneiform -l rus -o 1.txt out.bmp

Где out.bpm конвертированный image magick (просто convert out.pnm out.bmp) скан с помощью xsane с дефольтными настройками создает пустой файл 1.txt, не выводя никаких ошибок

а

tesseract out.png out_.txt -l rus

Создает UTF-8 текстовый файл с текстом, только распознанным совершенно не верно.

Может быть, нужны какие-то специфические настройки для сканера? Изображение по-умолчанию со сканера пожалуй особенной контрастностью не страдает.

У меня в убунте cuneiform и быстрее и лучше распознает, чем tesseract.

Рекомендую cuneiform.

anonymous ()
Ответ на: комментарий от sHaggy_caT

С теми, что и вы.

http://i.imgur.com/1Oi3H3M.jpg Вот такого вида скан старого журнала.

во ВАЕ Так, на основе устаревших В. Мк. 2 появились учебные машины Т. Мк. 21. В экспериментальном порядке те же «двойки» переоборудовались в беспилотные самолеты-мишени (). Мк. 10. Наиболее удачными можно считать две . модификации, выпущенные в небольшом

Это cuneiform.

во КАР. Так, на основе устаревших В. Мк. 2 появшшсь учебные матшшы Т. Мк. 21. В экспериментальном порядке те Же «двойки» переоборудовались в бестпшотные самоле- ты—мишетш О. Мк. 10. Наиболее удачньши можно считать две . модификации, вьшущенные в небольшом

А это tesseract.

anonymous ()
Ответ на: комментарий от anonymous

У меня тоже распознает Вашу картинку:

============== cuneiform -l rus -o 2.txt 1Oi3H3M.bmp Cuneiform for Linux 1.1.0

tesseract 1Oi3H3M.bmp 2_.txt -l rus Tesseract Open Source OCR Engine v3.01 with Leptonica

cat 2.txt во КАР. Так, на основе устаревших В. Мк. 2 появились учебные машины Т. Мк. 21. В экспериментальном порядке те же «двойки» переоборудовались в беспилотные самолеты-мишени 13. Мк. 10. Наиболее удачными можно считать две . модификации, выпущенные в небольшом

cat 2_.txt cat: 2_.txt: Нет такого файла или каталога

cat 2_.txt.txt во КАР. Так, на основе устаревхшіх В. Мк. 2 появшшсь учебные малппш Т. Мк. 21. В экспсримешальном порядке те же «двоўпси» переоборудовшшсь в бесшшотные самоле- тъп-мшлеъш Ш. Мк. 10. Наиболее удачнъши можно считать две модифш<э.циуЕ, вьптущсшше в небольшом ============

А вот мой скан не распознает, да и на вид контрастность Вашего скана куда больше! Расскажите, пожалуйста, как Вы сканируете, что бы я могла воспроизвести Ваш результат, и Вы мне очень поможете!

sHaggy_caT ()
Ответ на: комментарий от sHaggy_caT

Ой, тут форматировать нужно специфическим образом, сорри, не привыкла :(

sHaggy_caT ()
Ответ на: комментарий от sHaggy_caT

Сканирую полноцветное изображение с не менее чем 300 dpi, сохраняю в png. В xSane есть настройки яркости и контрасности, плюс авнонастройка (Ctrl-a) — если контрасность скана низкая, можно их покрутить. У меня простое МФУ hp там довольно несерьезный сканер. Вообще для распознования текста лучше сканировать в штриховом (двухцветном) режиме с разрешением 600 dpi, возможно так будет лучше.

anonymous ()
Ответ на: комментарий от anonymous

А что нажимать-то? Или консольные опции подскажите кто-нибудь плиз :( Если бы получалось, тему на форуме не создала бы....

sHaggy_caT ()
Ответ на: комментарий от fornlr

через yagf не распознаёт, и я консоли не боюсь :)

Чем поможет yagf, который сканирует через xsane? Если бы он сканировал через консольный sane с кастомными, yagf-ыми параметрами, то мог бы помочь.

sHaggy_caT ()
Ответ на: комментарий от sHaggy_caT

В xSane в нижней части окна есть три ползунка:

http://i.imgur.com/Hu36pPe.png

Гамма, яркость и контрастность. Вот их и крутить, стараясь сделать изображение четче. Плюс там есть кнопочка, третья слева, которая должна помочь выставить оптимальные настройки для изображения.

anonymous ()

Для cuneiform надо градации серого и хотя бы 150 dpi (чем больше, тем он распознаёт лучше).

dn2010 ★★★★★ ()
Ответ на: комментарий от sHaggy_caT

Ну если хочется в консоли, то можно например так сканировать:

scanimage -b --batch-start=01 --resolution 600 --batch-prompt --format tiff -p --mode Lineart

Будет предлагать положить на сканер страницу и нажать Enter.

anonymous ()
Ответ на: комментарий от dn2010

чем больше, тем он распознаёт лучше

Не факт. Больше 300, по моим наблюдениям, наоборот врать начинает. 150—300 оптимально.

massimus ★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.