ищу альтернативу FineReader, советуем

tesseract ocr?

TERRANZ ★★★★
(15.06.14 16:23:04 MSK)

Ссылка

Адекватного ничего вроде так и не появилось. Но есть всяктй онлайн-ocr (тот же файнридер), если объемы небольшие.

Panic_At_The_Kernel ★
(15.06.14 22:08:53 MSK)

Ответ на: комментарий от Panic_At_The_Kernel 15.06.14 22:08:53 MSK

Адекватного ничего вроде так и не появилось

прикольно.. если даже этого нет, то о каком десктопе и офисе тут мечтают местные диванные кукаретники, хм.. Мысли вслух.

Deleted
(15.06.14 23:03:14 MSK)

Ответ на: комментарий от Deleted 15.06.14 23:03:14 MSK

Учитывая что под любые операционные системы полноценной замены finereader нет, то всё нормально. Тем более у них есть web-сервис и консольная версия для linux.

dinn ★★★★★
(15.06.14 23:06:57 MSK)

Ответ на: комментарий от Deleted 15.06.14 23:03:14 MSK

За последние 20 лет, включая студнеческие годы, у меня не было потребности распознавать текст. Но ты можешь обратиться к разработчикам finereader'a, уж обработка графического файла никак на ОС не завязана, были бы покупатели скомпилировали бы под линукс.

~~sdio~~ ★★★★★
(15.06.14 23:13:32 MSK)

У меня получилось добиться более-менее адекватных результатов только с файнридером под вайном. Про консольную версию и веб-сервис узнал только сейчас.

xfilx ★★
(15.06.14 23:16:38 MSK)

Ссылка

Вот этой пользовался вроде бы (давно дело было — сработало) под FreeBSD: http://www.freshports.org/graphics/cuneiform/

iZEN ★★★★★
(15.06.14 23:16:55 MSK)

Ссылка

Ответ на: комментарий от sdio 15.06.14 23:13:32 MSK

Если разрабы идиоты то к API везде привяжутся. А таких большинство.

peregrine ★★★★★
(15.06.14 23:29:49 MSK)

Ссылка

Ответ на: комментарий от Deleted 15.06.14 23:03:14 MSK

Все зависит от твоих потребностей. Мне заглаза хватает то, что есть. Можешь fr в wine запустить. Я диплом в mso пилил и никакой lo или oo не сравнится.

deterok ★★★★★
(15.06.14 23:36:21 MSK)

Ты будешь ржать, но если задача одноразовая, то вне зависимости от объёма лучше всего справится толковая машинистка.

~~Stahl~~ ★★☆
(15.06.14 23:39:28 MSK)
Последнее исправление: Stahl 15.06.14 23:39:42 MSK (всего исправлений: 1)

Ссылка

Если только текст, то неплохая альтернативка в лице KBookOCR. Как сейчас, не знаю, но когда ее я ее юзал (2011), она была что-то вроде бетки, но с текстом справлялась неплохо.
UPD: собственно, вот. Жаль только не развивается оно, по-ходу.

comp00 ★★★★
(16.06.14 00:01:10 MSK)
Последнее исправление: comp00 16.06.14 00:06:14 MSK (всего исправлений: 1)

Ссылка

FR под wine. Других альтернатив нет.

petrosyan ★★★★★
(16.06.14 00:04:08 MSK)

Ответ на: комментарий от petrosyan 16.06.14 00:04:08 MSK

Других альтернатив нет.

readiris под wine

BMX ★★☆
(16.06.14 00:04:56 MSK)

OCRFeeder, gImageReader.
Насколько я понимаю, оба - гуй к тессеракту.

К слову, перестал пользоваться файнридером версии после пятой. Они там что-то намудрили - и пятая версия стала тормознее и хуже по распознаванию, чем третья-четвёртая.

devl547 ★★★★★
(16.06.14 00:07:38 MSK)
Последнее исправление: devl547 16.06.14 00:16:54 MSK (всего исправлений: 1)

недавно надо было распознать несколько картинок с текстом
FR не ставил - опенсурц же нужен
тессеракт норм. Вообще без ошибок. Вот только он, наверное, не может распознавать, когда 2+ языка на странице, потому что ему аргументом передается язык документа
ах да, дело было под вендой

ii343hbka ★★★
(16.06.14 00:11:36 MSK)
Последнее исправление: ii343hbka 16.06.14 00:11:54 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Deleted 15.06.14 23:03:14 MSK

Адекватного ничего вроде так и не появилось
прикольно.. если даже этого нет, то о каком десктопе и офисе тут мечтают местные диванные кукаретники, хм.. Мысли вслух.

мне очень понравилось слово «даже», лол %) сканировать и распознавать документы может нужно раз в год, или еще меньше. Руки не отвалятся, если набить ими.

~~dikiy~~ ★★☆☆☆
(16.06.14 00:14:31 MSK)

Ответ на: комментарий от BMX 16.06.14 00:04:56 MSK

Ириска имхо похуже будет.

petrosyan ★★★★★
(16.06.14 00:24:58 MSK)

Ссылка

Ответ на: комментарий от dinn 15.06.14 23:06:57 MSK

Полноценной замены для русскоязычных пользователей или вообще? Чем не устраивают, например, Readiris, OmniPage, Presto! OCR?

Ещё есть какой-то онлайновый сервис online ocr

grem ★★★★★
(16.06.14 00:33:14 MSK)

YAGF
Это гуй для tesseract или cuneiform. Вроде развивается, но я уже давно не следил. Для последних двух, ксати, есть собственные гуи, но cuneiform выглядит не очень живым.

valentin_v13 ★★★
(16.06.14 00:34:06 MSK)
Последнее исправление: valentin_v13 16.06.14 00:42:21 MSK (всего исправлений: 1)

YAGF

maxbart ★★
(16.06.14 00:34:42 MSK)

Ссылка

cuneiform'ом пользовался. Годится.

~~Eddy_Em~~ ☆☆☆☆☆
(16.06.14 00:37:01 MSK)

Ссылка

Ответ на: комментарий от dikiy 16.06.14 00:14:31 MSK

Последние несколько раз, когда я использовал тот же finereader для пары страниц из методичек, оставалось столько ошибок для исправления, что проще было самому напечатать. Среди госслужащих же, из тех случаев, что мне известны, всякие «распознавалки» в основном используются, чтобы отсканировать лист с подписями и сразу сохранить его как pdf без какого-либо выделения OCR слоя.

grem ★★★★★
(16.06.14 00:39:24 MSK)

Ссылка

Ответ на: комментарий от grem 16.06.14 00:33:14 MSK

Presto! OCR

Pagemanager от них классный был и распознавал заметно быстрее FineReader.
Только с кириллицей большие проблемы были, как помню. Как и у OmniPage.

devl547 ★★★★★
(16.06.14 00:47:40 MSK)
Последнее исправление: devl547 16.06.14 00:48:36 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от valentin_v13 16.06.14 00:34:06 MSK

Ментейнер cuneiform for linux написал в 2011 г.

Cuneiform for Linux is no longer maintained. If you are interested in taking over the maintenance, please post to the team mailing list.

В 2012 г. появился новый ментейнер, но что-то с тех пор действительно тихо.

grem ★★★★★
(16.06.14 00:50:43 MSK)

~~Zangezi~~, тег «ocr» проставь, может пригодится кому.

valentin_v13 ★★★
(16.06.14 00:51:54 MSK)

Ссылка

google docs

TheAnonymous ★★★★★
(16.06.14 00:52:50 MSK)

Ссылка

Ответ на: комментарий от grem 16.06.14 00:50:43 MSK

Ну да, и на официальном сайте и форуме всё мертво.

valentin_v13 ★★★
(16.06.14 00:59:38 MSK)

Ссылка

Ответ на: комментарий от grem 16.06.14 00:50:43 MSK

Tesseract, на самом деле, тоже выглядит довольно печально. Почти все последние изменения за 2012 год.

valentin_v13 ★★★
(16.06.14 01:04:42 MSK)

Ссылка

Я пробовал tesseract, на удивление хорошо распознаёт даже русский текст, ошибок практически нет. К нему есть разные GUI, например OCRFeeder. В текстовый редактор передать проблем нет, но лично у меня слетало форматирование, то есть текст передаётся без учёта абзацев, отступов и тому подобного. Впрочем с этим и у FineReader проблемы бывают. А так работает вполне нормально. Ещё есть cuneiform, насчёт него ничего не скажу, говорят вроде работает.

mbivanyuk ★★★★★
(16.06.14 04:26:15 MSK)

Ссылка

Ответ на: комментарий от dinn 15.06.14 23:06:57 MSK

Учитывая что под любые операционные системы полноценной замены finereader нет

врешь проплаченный тест

fornlr ★★★★★
(16.06.14 05:13:27 MSK)
Последнее исправление: fornlr 16.06.14 05:16:35 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от dinn 15.06.14 23:06:57 MSK

полноценной замены finereader нет

ну полноценной ладно, много чего полноценного нет, но как же без распознавания текста, это же весьма востребованная функция.

Deleted
(16.06.14 08:26:44 MSK)

Ссылка

Ответ на: комментарий от sdio 15.06.14 23:13:32 MSK

За последние 20 лет, включая студнеческие годы, у меня не было потребности распознавать текст

у тебя не было, а у меня каждый день, и шо? Как всегда - напиши сам, хэх. А профессиональные программисты будут клепать очередной говноплеер или ненужную перделку типа КДЕ, канешно, это ж куда важнее.

Deleted
(16.06.14 08:29:34 MSK)

Ответ на: комментарий от dikiy 16.06.14 00:14:31 MSK

мне очень понравилось слово «даже», лол %) сканировать и распознавать документы может нужно раз в год, или еще меньше. Руки не отвалятся, если набить ими.

тебе может и раз в год, а многие люди этим занимаются постоянно, и руки-таки отвалятся каждый день страниц по 50 набивать. Это как всегда - если в линупсе нет, значит и не нужно. Флеша нет - ну и не нужно, офиса нормального нет - ну хрен с ним. Зато видимо сотни говноплееров нужны.

Deleted
(16.06.14 08:33:01 MSK)

Ответ на: комментарий от grem 16.06.14 00:33:14 MSK

Вообще, чем не устраивают не скажу - еще не опробовал, просто спросил совета, так как понятия не имею какой софт есть в онтопике для распознавания.

Deleted
(16.06.14 08:36:27 MSK)

Ссылка

Ответ на: комментарий от deterok 15.06.14 23:36:21 MSK

Все зависит от твоих потребностей. Мне заглаза хватает то, что есть. Можешь fr в wine запустить. Я диплом в mso пилил и никакой lo или oo не сравнится.

Попробую сперва нативные аналоги, потом посмотрим насчет вайна. Кстати в ворде под вайном такие шрифты вырвиглазные, как-то с этим боролся или плюнул и ломал глаза?

Deleted
(16.06.14 08:38:28 MSK)

https://launchpad.net/cuneiform-linux

anonymous
(16.06.14 08:41:27 MSK)

Ссылка

Ответ на: комментарий от devl547 16.06.14 00:07:38 MSK

Самое время бежать на 12-ую...качество на высоте...

Правда в качестве источника проивзодительности - Винда

bookman900 ★★★★★
(16.06.14 08:54:34 MSK)

Tesseract распознает замечательно, наркоман. Не больше 1% ошибок на страницу текста.

anonymous
(16.06.14 08:56:06 MSK)

Ответ на: комментарий от bookman900 16.06.14 08:54:34 MSK

Уже лет 5-6 нет смысла.
Это раньше приходилось кучу документов в электронный вид перегонять.

devl547 ★★★★★
(16.06.14 09:04:11 MSK)

Ссылка

cuneiform

pyometra ★★★★★
(16.06.14 09:21:34 MSK)

Ссылка

Ответ на: комментарий от Deleted 16.06.14 08:29:34 MSK

Как всегда - напиши сам, хэх.

Движки есть. Почему кто-то бесплатно для тебя их будет обучать? Заплати за проприетарную программу и не бухти. Впрочем вся эта тема чистый вброс, т.к. если бы тебе это реально было нужно, вопрос ставился бы иначе.

~~sdio~~ ★★★★★
(16.06.14 09:39:04 MSK)

Ссылка

Ответ на: комментарий от Deleted 16.06.14 08:33:01 MSK

а многие люди этим занимаются постоянно

Кто эти люди?

Флеша нет

есть

офиса нормального нет

есть

Зато видимо сотни говноплееров нужны.

От этого никому не жмёт, ну, кроме тебя конечно.

~~sdio~~ ★★★★★
(16.06.14 09:41:52 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.06.14 08:56:06 MSK

Tesseract распознает замечательно, наркоман. Не больше 1% ошибок на страницу текста.

Разве что сферического текста.

свободные OCR не дают стабильного результата даже на отсканированных изображениях, Finereader стоит денег — простому пользователю проще пользоваться онлайн-сервисами. Ну а если вы собираетесь использовать OCR в других масштабах — тут другой разговор: придется платить или тратить время на корректировку результатов вручную.

http://habrahabr.ru/post/153617/

anonymous
(16.06.14 09:53:54 MSK)

Ответ на: комментарий от Deleted 16.06.14 08:33:01 MSK

мне очень понравилось слово «даже», лол %) сканировать и распознавать документы может нужно раз в год, или еще меньше. Руки не отвалятся, если набить ими.

тебе может и раз в год, а многие люди этим занимаются постоянно, и руки-таки отвалятся каждый день страниц по 50 набивать. Это как всегда - если в линупсе нет, значит и не нужно. Флеша нет - ну и не нужно, офиса нормального нет - ну хрен с ним. Зато видимо сотни говноплееров нужны.

может и нужно, но слово «даже» тут не в кассу.

~~dikiy~~ ★★☆☆☆
(16.06.14 12:58:32 MSK)

Ссылка

Ответ на: комментарий от anonymous 16.06.14 09:53:54 MSK

Неверных слов 6 (в тексте 728 слов)
Неверных слов: 1 (в тексте 534 слова)

Дай угадаю: математику на ЕГЭ завалил?

anonymous
(16.06.14 13:11:03 MSK)

Ссылка

Ответ на: комментарий от Deleted 15.06.14 23:03:14 MSK

если даже этого нет, то о каком десктопе и офисе тут мечтают местные диванные кукаретники

Убейся, быдло.

~~srrmk~~
(16.06.14 13:13:56 MSK)

Ссылка

Ответ на: комментарий от Deleted 16.06.14 08:38:28 MSK

У меня все нормально. Может надо шрифты доставить?

deterok ★★★★★
(16.06.14 13:16:32 MSK)

Ссылка

Ответ на: комментарий от Deleted 16.06.14 08:29:34 MSK

А профессиональные программисты будут клепать очередной говноплеер или ненужную перделку типа КДЕ, канешно, это ж куда важнее.

Удивительно, правда? А всё потому, что профессиональным программистам пофигу, что там нужно офисному планктону, который нахаляву пытается всех поиметь.

anonymous
(16.06.14 13:26:28 MSK)

Ссылка

Ответ на: комментарий от Deleted 16.06.14 08:29:34 MSK

Вот ты здесь ноешь, но забываешь одну важную вещь - тебе никто ничего не должен.

Хочешь то, что ненужно большинству типичных юзеров? Может, покажешь свои багрепорты в свободные OCR? Или патчи? Или хотя бы квитанции донейтов?

Ну, чтобы понимать, что твои претензии имеют хоть какую-то почву.

А профессиональные программисты будут клепать очередной говноплеер или ненужную перделку типа КДЕ, канешно, это ж куда важнее.

Может, ты оплачиваешь из своего кармана их время, чтобы возмущаться их трудом?

anonymous8 ★★
(16.06.14 13:43:00 MSK)

Ответ на: комментарий от anonymous8 16.06.14 13:43:00 MSK

GPL не запрещает возмущаться их трудом ;-)

kma21 ★★★★★
(17.06.14 18:59:15 MSK)

Ссылка

Похожие темы