LINUX.ORG.RU

Обзор OCR-софта под linux


0

0

Сравнительный обзор доступных приложений для распознавания текста в среде linux, подготовленный Остином Эктоном (Austin Acton)

Достаточно интересно и познавательно :)

>>> Подробности

★★★★★

Проверено: Obidos ()

Ответ на: комментарий от MuZHiK-2

> Что нибудь с поддержкой кириллицы появилось или все темный лес?

Говорят, Clara поддаётся обучению. А ещё есть FineReader (проверено под Wine 0.9.37) :)

acheron ★★★★
()
Ответ на: комментарий от acheron

О ! А вот обучение это здорово ! Если бы можно было посидеть по сканировать-распознавать, обучить и поделитсья результатами обучения, чтоб в следующей версии заработало из коробки было бы круто. Надо будет в свободное время заняться :)

Archangel_Azrael
()
Ответ на: комментарий от acheron

Надеюсь, что так оно и будет. Чего еще там не хватает пользователям? Пожалуй только игр с фотошопом...

anonymous
()
Ответ на: комментарий от anonymous

>фотошопом...

Вроде ж есть несколько проприетарных аналогов под Linux включая pixel32 и какой-то более достойный.

Davidov ★★★★
()
Ответ на: комментарий от Korwin

>Пользуюсь ReadIris 11 и доволен.

что то не нашел версии для линукс...

на оффсайте только оффтопик и... оффтопик (винда и макось)

anonymous
()
Ответ на: комментарий от Korwin

>Пользуюсь ReadIris 11 и доволен.

Она 130 уев стоит

vada ★★★★★
()
Ответ на: комментарий от Korwin

Мужики, не понял, при чем тут линукс? На сайте нету линукс-версии это проги. Тем более 130 уев, да.. дороговато, дороже самого сканера)) Но в Abbyy мудаки бесят, не уж то так сложно хотя бы простенький бэкэнд прикрутить к движку? без колебаний купил бы за ту же штуку, что для винды продают.

MuZHiK-2 ★★★★
()
Ответ на: комментарий от MuZHiK-2

А что GOCR не умеет разве русский понимать ? Вроде чудно работает в связке с GUI QuiteInsane + либы Sane для сканеров ... Может конечно не так быстро как ФайнРиадер, но за то опен соурс !

anonymous
()

ocrad polojenie3.pgm
W.S.B7tanc_buaM RXT peKoMeWWe__ NWeTb cIpaxoao�nonNc no rp_aHcxo�
U.LBCTCTBCHHOCTN 3a ElaHcceHNe ywep6a TpeTbNM nNuaM.
9. CB_3b N nepNoAN_ecwNe RoKnaRbl.
9.1. KalEan AnH LRR._N Ha yKD - 72 CTa_Tog_ n_oue_ypa 6yAeT Uy6nNpoaaTbcR no paANo.
U.2. Ka*o_ R_T_ o6R_aHa no___44_aaTb Ela c)_WHo conpoao_eHNR NnN Ha onpeAenewHy_ AnR
+TOrO [)prdllN_aUNoHwblM Ko,NNTeToM _xTy NH_opMauN_ o caoeM MecToHaxo*AewNN
Ka_ahlc 4 _aca, Ha_NH_ c OG _lacoa IS N__R. npoUeAypa AownaAa 6y_eT llonpo6Ho
o_INcaHa B I'OHO_HO�NHcTpyKuNN
IO. npoueRypa perNcTpaUNN N c_apToable B3HOCbl.
IO.l. MallaaTHaR _OMNCCNR cnpeaHoaaHN�pa6oTaeT B noMeWeHNN Pe_Horo _xT-Kny6a O4 N
11 N_7tR 2007 rooa c IB.OO AO 20.00 _acoa. B MaHAaTHy_ KOMNCCN_ AOn*Hhl 6blTb
n_eAcTaaneH_ cneoy_wNe Ao_WcHTbl.
3_axa lla y_acTNe;
ne�TaNTenbHoe .wcpNTe__bHoe caNAerenbcT_o NnN ero KonNR;
/T_�TRNEenbHbl�cy_oBo�6NneT c oTMeTKo�o _OHOCTN K nn_N_;
rlFa_a p!_leDoro TKallN raHa) RXrbl N cTapwero noMo_HNKa,
ntK._apauNR anaAc__bud;
Re___ap_uNR KanNTa_la;
L'TaHAdpTHaR xapTa KollTponhHoro ocMnTpa ORC N neKnapauNR KanNTaHa;
Rxlbl, He npchcTaaNawlle IanNcN Ha y_acTNe N Ae�TaNTenbH_e MepNTenbHble
c_NA_Tc_TbcTaa _Tn oKoH_aHNR pa6oTbl MaH_aTHo�KOMNCCNN 11 N___R 2007 roAa, K
copeRwoaaHN__ He _om_cKa_TcR.
IU.2. CTapToablh _3H0C ycT_HaanNaaeTcR g p_Mepe 1000 py6. c Ka*Ao�RXT_. Cn6paHllbEe
cpeucTaa pacxooWTcR Ha _enN, orrpe_e._eHHb[e npe3NONyMoM cnnc.
ll. PeKnaMa.
Ha copeaHoRallNN _e�Tgym _pe6oaaHNR no pewnaNe KaTeropNN C pernaMeHTa ISAF
__KoAeKc no peKnaMe>T (nywKT 20 PcrnaMeHTa ISAF). OpraHN_aTopbl MoryT o6R_aTb
)'_acTHNKoa llecTN peK_aMy cnoHcopog copegHoaaHN�a cooTaeTcTaNN c Tpe6ogaHNRMN ll.20
PerllaMellTa lsnF ((KoAeKc no peKnaMc)). OprxoMNTeT anpaae o6__aTb KanNTaHog gKn__NTb a
_KNn�K no ohHoMy npeOcTaaNTe__ KoMnaHw - reHepanbHoro cnoHcopa.
|2. Harpaw_eHHe.
12.1.1_cpe_uHNR Harp_xAcHNR COCTONTC_ s aa_cTa B |9.00 _acoa B caHwT-neTep6yprcKoM
_C_HOM RxI-___y6e. Bcc y_acTHNKN peraTbl npNrnawa_Tc_ Ha uepeMoHN_ H_pa*AeHNR.
| .2. noF)cAmenN R Ka*Uo�la_eTHo�rpynne Ha_a*Aa_Tt_ Ky6waMN, ANnnoMaMN, Me_anRMN
N naMRTH_mtN npN3aMN B cooTgeTcTgNN c nono*eHNeM o npN3ax opraHN_aTopoa N
cnoHtnpoD.
|3. NH_opMaUNR N o6c._y*HaaHNe.
|3 l Pacxna_ Ha y_acTNe B peraTe RXT N RxTcMeHoa Hecyf WacTHNKN N WatTgywWNe
opraHN3aUNN.
13.2. OpraEIN_auNoHHble pac_onbl no npoaeReHNw copeaHnaaHNR N xoMdHANpoaaHN_ cyue�
Hecc\ OprKoMNT_ perarbl.
| _.3 NH_opMa_N_ o peraTe _O*HO nony_NTb no Tene_oHaM:

vada ★★★★★
()
Ответ на: комментарий от vada

U.LBCTCTBCHHOCTN 3a ElaHcceHNe ywep6a TpeTbNM nNuaM. Ответсвтенность за нанесение ущерба третим лицам ??? Это кто так распознал ?

anonymous
()
Ответ на: комментарий от vada

> Ha copeaHoRallNN _e�Tgym _pe6oaaHNR no pewnaNe KaTeropNN C pernaMeHTa

На соревновании е&#ут первонахов по решению Катерины из парламента?

grad
()
Ответ на: комментарий от anonymous

>U.LBCTCTBCHHOCTN 3a ElaHcceHNe ywep6a TpeTbNM nNuaM. Ответсвтенность за нанесение ущерба третим лицам ??? Это кто так распознал ?

ocrad

См. первую строку поста

vada ★★★★★
()
Ответ на: комментарий от MuZHiK-2

> Нет, в gocr кириллица толком не прикручена

Хуже того -- её там вообще нет

AP ★★★★★
()

Достаточно прочитать, что "размер файла с отсканированным изображением в зависимости от разрешения растет экспоненциально", чтобы понять, что автор не обременен... ммм... ничем. Очевидно, что размер файла растет как квадрат разрешения. Дальше не читал.

anonymous
()

Короче, мужики, в этой области все как и раньше - нихрена нет.

MuZHiK-2 ★★★★
()

А зачем он вам нужен? Книжки сканировать что ли?

true
()
Ответ на: комментарий от vada

>crad polojenie3.pgm
>W.S.B7tanc_buaM RXT peKoMeWWe__ NWeTb cIpaxoao�nonNc no
>rp_aHcxo�
>U.LBCTCTBCHHOCTN 3a ElaHcceHNe ywep6a TpeTbNM nNuaM.
>9. CB_3b N nepNoAN_ecwNe RoKnaRbl


В мордовско-эльфийском языке не силен...

Alphaer ★★
()
Ответ на: комментарий от anonymous

>Достаточно прочитать, что "размер файла с отсканированным изображением в зависимости от разрешения растет экспоненциально", чтобы понять, что автор не обременен... ммм... ничем. Очевидно, что размер файла растет как квадрат разрешения. Дальше не читал.

аффтар наверно имел ввиду "квадратично", только слово забыл... или описался. зачем так строго судить. Про DPI он ваще зря парился. Общеизвестно, что 300 это оптимально.

scyld
()
Ответ на: комментарий от MuZHiK-2

>Что нибудь с поддержкой кириллицы появилось или все темный лес?

vividata ocrshop - 30 дней trial + perl скрипт на обход проверки. работает через юникод

Штука консольная, ввод доп. параметров сделан через ж*пу, несмотря на возможность отправлять некоторые переменные в форме $SMTH, но, тем не менее работает и более-менее нормально распознает. К несчастью на нормальный клиент (якобы light, но который ближе к unix-way) perl скриптов не водится, а самому ломать влом :(

ZloySergant
()
Ответ на: комментарий от anonymous

LinuxFormat январь 2007 №1 (87/88) Статья "QuiteInsane: посканируем!" цитата: "Распознавание символов – процесс неточный, и финальный текст может потребовать небольшого [а в случае текста на русском языке и большого, – прим.ред.] редактирования." - кто не прав ?

anonymous
()
Ответ на: комментарий от anonymous

> Статья "QuiteInsane: посканируем!"

В QuiteInsane/CVS коммитов не было 4 года. Они что, правда опубликовали статью об этом приложении???

AP ★★★★★
()
Ответ на: комментарий от Evgueni

Не понимаю я этих юмористов из британского LXF: XSane и выходит чаще, и умеет больше.

AP ★★★★★
()
Ответ на: комментарий от GreyDoom

Это всего лишь голый движок за ту сумму, которую уже озвучили, но никто нихрена (даже платных) продуктов не делает пока.

MuZHiK-2 ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.