LINUX.ORG.RU

ищу альтернативу FineReader, советуем


0

1

нужно шоб умело отсканировать, распознать и передать сразу в тестовый редактор, в тот же Writer, например. Больше от сабжа ничего не нужно, только текст. Ну и адекватная работа с ним, ясный пень, а не вопросительные знаки вместо букофф. Языки - инглиш, русский и украинский.

Deleted

Адекватного ничего вроде так и не появилось. Но есть всяктй онлайн-ocr (тот же файнридер), если объемы небольшие.

Panic_At_The_Kernel
()
Ответ на: комментарий от Panic_At_The_Kernel

Адекватного ничего вроде так и не появилось

прикольно.. если даже этого нет, то о каком десктопе и офисе тут мечтают местные диванные кукаретники, хм.. Мысли вслух.

Deleted
()
Ответ на: комментарий от Deleted

Учитывая что под любые операционные системы полноценной замены finereader нет, то всё нормально. Тем более у них есть web-сервис и консольная версия для linux.

dinn ★★★★★
()
Ответ на: комментарий от Deleted

За последние 20 лет, включая студнеческие годы, у меня не было потребности распознавать текст. Но ты можешь обратиться к разработчикам finereader'a, уж обработка графического файла никак на ОС не завязана, были бы покупатели скомпилировали бы под линукс.

sdio ★★★★★
()

У меня получилось добиться более-менее адекватных результатов только с файнридером под вайном. Про консольную версию и веб-сервис узнал только сейчас.

xfilx ★★
()
Ответ на: комментарий от sdio

Если разрабы идиоты то к API везде привяжутся. А таких большинство.

peregrine ★★★★★
()
Ответ на: комментарий от Deleted

Все зависит от твоих потребностей. Мне заглаза хватает то, что есть. Можешь fr в wine запустить. Я диплом в mso пилил и никакой lo или oo не сравнится.

deterok ★★★★★
()

Ты будешь ржать, но если задача одноразовая, то вне зависимости от объёма лучше всего справится толковая машинистка.

Stahl ★★☆
()
Последнее исправление: Stahl (всего исправлений: 1)

Если только текст, то неплохая альтернативка в лице KBookOCR. Как сейчас, не знаю, но когда ее я ее юзал (2011), она была что-то вроде бетки, но с текстом справлялась неплохо.
UPD: собственно, вот. Жаль только не развивается оно, по-ходу.

comp00 ★★★★
()
Последнее исправление: comp00 (всего исправлений: 1)

OCRFeeder, gImageReader.
Насколько я понимаю, оба - гуй к тессеракту.

К слову, перестал пользоваться файнридером версии после пятой. Они там что-то намудрили - и пятая версия стала тормознее и хуже по распознаванию, чем третья-четвёртая.

devl547 ★★★★★
()
Последнее исправление: devl547 (всего исправлений: 1)

недавно надо было распознать несколько картинок с текстом
FR не ставил - опенсурц же нужен
тессеракт норм. Вообще без ошибок. Вот только он, наверное, не может распознавать, когда 2+ языка на странице, потому что ему аргументом передается язык документа
ах да, дело было под вендой

ii343hbka ★★★
()
Последнее исправление: ii343hbka (всего исправлений: 1)
Ответ на: комментарий от Deleted

Адекватного ничего вроде так и не появилось

прикольно.. если даже этого нет, то о каком десктопе и офисе тут мечтают местные диванные кукаретники, хм.. Мысли вслух.

мне очень понравилось слово «даже», лол %) сканировать и распознавать документы может нужно раз в год, или еще меньше. Руки не отвалятся, если набить ими.

dikiy ★★☆☆☆
()
Ответ на: комментарий от dinn

Полноценной замены для русскоязычных пользователей или вообще? Чем не устраивают, например, Readiris, OmniPage, Presto! OCR?

Ещё есть какой-то онлайновый сервис online ocr

grem ★★★★★
()

YAGF
Это гуй для tesseract или cuneiform. Вроде развивается, но я уже давно не следил. Для последних двух, ксати, есть собственные гуи, но cuneiform выглядит не очень живым.

valentin_v13 ★★★
()
Последнее исправление: valentin_v13 (всего исправлений: 1)

cuneiform'ом пользовался. Годится.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от dikiy

Последние несколько раз, когда я использовал тот же finereader для пары страниц из методичек, оставалось столько ошибок для исправления, что проще было самому напечатать. Среди госслужащих же, из тех случаев, что мне известны, всякие «распознавалки» в основном используются, чтобы отсканировать лист с подписями и сразу сохранить его как pdf без какого-либо выделения OCR слоя.

grem ★★★★★
()
Ответ на: комментарий от grem

Presto! OCR

Pagemanager от них классный был и распознавал заметно быстрее FineReader.
Только с кириллицей большие проблемы были, как помню. Как и у OmniPage.

devl547 ★★★★★
()
Последнее исправление: devl547 (всего исправлений: 1)
Ответ на: комментарий от valentin_v13

Ментейнер cuneiform for linux написал в 2011 г.

Cuneiform for Linux is no longer maintained. If you are interested in taking over the maintenance, please post to the team mailing list.

В 2012 г. появился новый ментейнер, но что-то с тех пор действительно тихо.

grem ★★★★★
()
Ответ на: комментарий от grem

Tesseract, на самом деле, тоже выглядит довольно печально. Почти все последние изменения за 2012 год.

valentin_v13 ★★★
()

Я пробовал tesseract, на удивление хорошо распознаёт даже русский текст, ошибок практически нет. К нему есть разные GUI, например OCRFeeder. В текстовый редактор передать проблем нет, но лично у меня слетало форматирование, то есть текст передаётся без учёта абзацев, отступов и тому подобного. Впрочем с этим и у FineReader проблемы бывают. А так работает вполне нормально. Ещё есть cuneiform, насчёт него ничего не скажу, говорят вроде работает.

mbivanyuk ★★★★★
()
Ответ на: комментарий от dinn

полноценной замены finereader нет

ну полноценной ладно, много чего полноценного нет, но как же без распознавания текста, это же весьма востребованная функция.

Deleted
()
Ответ на: комментарий от sdio

За последние 20 лет, включая студнеческие годы, у меня не было потребности распознавать текст

у тебя не было, а у меня каждый день, и шо? Как всегда - напиши сам, хэх. А профессиональные программисты будут клепать очередной говноплеер или ненужную перделку типа КДЕ, канешно, это ж куда важнее.

Deleted
()
Ответ на: комментарий от dikiy

мне очень понравилось слово «даже», лол %) сканировать и распознавать документы может нужно раз в год, или еще меньше. Руки не отвалятся, если набить ими.

тебе может и раз в год, а многие люди этим занимаются постоянно, и руки-таки отвалятся каждый день страниц по 50 набивать. Это как всегда - если в линупсе нет, значит и не нужно. Флеша нет - ну и не нужно, офиса нормального нет - ну хрен с ним. Зато видимо сотни говноплееров нужны.

Deleted
()
Ответ на: комментарий от grem

Вообще, чем не устраивают не скажу - еще не опробовал, просто спросил совета, так как понятия не имею какой софт есть в онтопике для распознавания.

Deleted
()
Ответ на: комментарий от deterok

Все зависит от твоих потребностей. Мне заглаза хватает то, что есть. Можешь fr в wine запустить. Я диплом в mso пилил и никакой lo или oo не сравнится.

Попробую сперва нативные аналоги, потом посмотрим насчет вайна. Кстати в ворде под вайном такие шрифты вырвиглазные, как-то с этим боролся или плюнул и ломал глаза?

Deleted
()

Tesseract распознает замечательно, наркоман. Не больше 1% ошибок на страницу текста.

anonymous
()
Ответ на: комментарий от bookman900

Уже лет 5-6 нет смысла.
Это раньше приходилось кучу документов в электронный вид перегонять.

devl547 ★★★★★
()
Ответ на: комментарий от Deleted

Как всегда - напиши сам, хэх.

Движки есть. Почему кто-то бесплатно для тебя их будет обучать? Заплати за проприетарную программу и не бухти. Впрочем вся эта тема чистый вброс, т.к. если бы тебе это реально было нужно, вопрос ставился бы иначе.

sdio ★★★★★
()
Ответ на: комментарий от Deleted

а многие люди этим занимаются постоянно

Кто эти люди?

Флеша нет

есть

офиса нормального нет

есть

Зато видимо сотни говноплееров нужны.

От этого никому не жмёт, ну, кроме тебя конечно.

sdio ★★★★★
()
Ответ на: комментарий от anonymous

Tesseract распознает замечательно, наркоман. Не больше 1% ошибок на страницу текста.

Разве что сферического текста.

свободные OCR не дают стабильного результата даже на отсканированных изображениях, Finereader стоит денег — простому пользователю проще пользоваться онлайн-сервисами. Ну а если вы собираетесь использовать OCR в других масштабах — тут другой разговор: придется платить или тратить время на корректировку результатов вручную.

http://habrahabr.ru/post/153617/

anonymous
()
Ответ на: комментарий от Deleted


мне очень понравилось слово «даже», лол %) сканировать и распознавать документы может нужно раз в год, или еще меньше. Руки не отвалятся, если набить ими.


тебе может и раз в год, а многие люди этим занимаются постоянно, и руки-таки отвалятся каждый день страниц по 50 набивать. Это как всегда - если в линупсе нет, значит и не нужно. Флеша нет - ну и не нужно, офиса нормального нет - ну хрен с ним. Зато видимо сотни говноплееров нужны.


может и нужно, но слово «даже» тут не в кассу.

dikiy ★★☆☆☆
()
Ответ на: комментарий от anonymous

Неверных слов 6 (в тексте 728 слов)
Неверных слов: 1 (в тексте 534 слова)

Дай угадаю: математику на ЕГЭ завалил?

anonymous
()
Ответ на: комментарий от Deleted

если даже этого нет, то о каком десктопе и офисе тут мечтают местные диванные кукаретники

Убейся, быдло.

srrmk
()
Ответ на: комментарий от Deleted

У меня все нормально. Может надо шрифты доставить?

deterok ★★★★★
()
Ответ на: комментарий от Deleted

А профессиональные программисты будут клепать очередной говноплеер или ненужную перделку типа КДЕ, канешно, это ж куда важнее.

Удивительно, правда? А всё потому, что профессиональным программистам пофигу, что там нужно офисному планктону, который нахаляву пытается всех поиметь.

anonymous
()
Ответ на: комментарий от Deleted

Вот ты здесь ноешь, но забываешь одну важную вещь - тебе никто ничего не должен.

Хочешь то, что ненужно большинству типичных юзеров? Может, покажешь свои багрепорты в свободные OCR? Или патчи? Или хотя бы квитанции донейтов?

Ну, чтобы понимать, что твои претензии имеют хоть какую-то почву.

А профессиональные программисты будут клепать очередной говноплеер или ненужную перделку типа КДЕ, канешно, это ж куда важнее.

Может, ты оплачиваешь из своего кармана их время, чтобы возмущаться их трудом?

anonymous8 ★★
()
Ответ на: комментарий от anonymous8

GPL не запрещает возмущаться их трудом ;-)

kma21 ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.