LINUX.ORG.RU
ФорумTalks

Информация о распознавании текста, распознавании образов


1

2

Подскажите, кто знает, что стоит почитать по распознаванию образов вообще и по распознаванию текста в частности.

PS: Гуглить умею, пока не забанили. Но хочется услышать рекомендации от тех, кто с этим сталкивался.


Forsyth D, Ponce J — Computer Vision a Modern Approach (есть на русском в бюджетном варианте)

p.s. не сталкивался, просто в библиотеке лежит :-)

Ok ()
Ответ на: комментарий от Deleted

> man нейронные сети

Не столько нейронные сети, сколько машинное обучение вообще и задача классификации в частности.

eveel ★★ ()
Ответ на: комментарий от Deleted

Нейросети используют там, где ничего более шустрого не могут придумать. К распознавание текста это уже давно не относится.

segfault ★★★★★ ()
Ответ на: комментарий от segfault

И что там более умное используют? И почему самый успешный finereader использует таки медленные нейросети?

Deleted ()
Ответ на: комментарий от Deleted

Потому что _самому_фичастому_ файнридеру до лампочки быстродействие - им важнее сделать экспорт в doc/xls, и пользователи будут выбирать его.

segfault ★★★★★ ()
Ответ на: комментарий от Deleted

> почему самый успешный finereader использует таки медленные нейросети

Мне попадалась книжка доктора наук, под руководством которого было запилено ядро файнридера. Так вот нейронные сети там - отнюдь не самое главное, там куда более нетривиальные и содержательные механизмы используются. Книжку найти не могу, но в качестве огрызка - могу предложить прочитать http://ru.wikipedia.org/wiki/Фонтанное_преобразование

Manhunt ★★★★★ ()
Ответ на: комментарий от Manhunt

Дело было давно, воспоминания смутные. Книжка была этого же автора: http://www.ozon.ru/context/detail/id/2788303/

И вот еще огрызок о том, что под капотом у файнридера: http://www.ocrai.narod.ru/fr.html

Согласно принципу целостности, каждый объект (например, человек) состоит из значимых частей (голова, руки, ноги, туловище), находящихся в определенных отношениях друг с другом (голова находится наверху туловища, руки - на противоположных сторонах туловища, ноги не могут быть выше рук). Если нам нужно распознать объект, мы должны найти все составляющие его части и проверить, выполняются ли заданные для них отношения.

Второй принцип - целенаправленность. Распознавание строится как процесс выдвижения и доказательства или опровержения гипотез. Например, услышав шорох в углу темной комнаты, мы делаем предположение, что это кошка. И пытаемся опровергнуть нашу догадку или подтвердить ее. Мы говорим себе: «Если это кошка, то у нее должны быть голова кошки, лапы кошки, кошачий хвост и она должна мяукать». Когда мы разглядим в темноте все перечисленные части и удостоверимся, что они соответствуют нашим представлениям о кошке, мы «распознаем» кошку. Таким образом, мы не просто наблюдали объект, а вначале выдвинули гипотезу о том, что он собой представляет, и начали целенаправленно искать черты, присущие этому объекту.

Manhunt ★★★★★ ()

>что стоит почитать по распознаванию образов вообще

7 обязательных книжек по теории распознавания образов и журнал Pattern Recognition and Image Analysis.

>и по распознаванию текста в частности

Интернет-проект, посвященный всем аспектам тематики распознавания рукописного и печатного текста.

>рекомендации от тех, кто с этим сталкивался

«Нельзя объять необъятное» (с) Козьма Прутков.
Поэтому вероятность успеха в задачах распознавания обратно пропорциональна размытости постановки условий.

quickquest ★★★★★ ()

leptonica, cuneiform (который основывается на лептонике)…

Читаем до просвещения Гонсалеса и Вудса.

// и вообще, вопрос не туда задан

Eddy_Em ☆☆☆☆☆ ()

У. Гибсон «Распознавание образов».

buddhist ★★★★★ ()
Ответ на: комментарий от blex

Книгу Вапника и книгу Фу - это классика жанра.
Ещё - Горелик и Скрыпник по статистическим методам.

pacify ★★★★★ ()
Ответ на: комментарий от Manhunt

Книжка была этого же автора: http://www.ozon.ru/context/detail/id/2788303/

Спасибо за информацию, заказал себе такую.
Видимо, ядро файнридера в разное время писали различные люди ))
Я был знаком с другой командой.

pacify ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.