LINUX.ORG.RU
решено ФорумTalks

А как сделано распознавание букв?

 ,


0

1

Простой вопрос для спв: вот есть программы, которые распознают текст с фотографии. А как они это делают? Есть ли у них база с примерами циферок и букв, написанных разным почерком, или там хитрючие алгоритмы и машинное обучение? Если это база, то насколько она большая? Кто-нибудь её видел?

В гугле забанили? просто загугли OCR, контента до вечера хватит

jeuta ★★★★
()

Если это база, то насколько она большая?

Примеры буквобаз ©.

quickquest ★★★★★
()

Ммм… Спасибо, посмотрел и погуглил.

Knigochey
() автор топика

http://www-e.uni-magdeburg.de/jschulen/ocr/download.html — самая маленькая из работоспособных. Только печатный латинский шрифт. 430к в TGZ.

https://launchpad.net/cuneiform-linux — 25M, не было релизов 8 лет, но распознаёт гораздо лучше, есть печатный русский.

question4 ★★★★★
()
Последнее исправление: question4 (всего исправлений: 1)
Ответ на: комментарий от turtle_bazon

Кратко - нейронные сетки

Спорный вопрос. Хотя - судя по качеству работы…

Например у него какие-то проблемы с black и white листами символов. Что ты их установил, что нет - одновалентно в 99.(9)% случаев. Как в принципе и с туевой хучей настроек, которые очевидны на первый взгляд, но практически результата применения не заметно.

HIS
()
Последнее исправление: HIS (всего исправлений: 1)

ML намазан во все поля. При том в несколько этапов, а не просто на картинку посмотреть. тексты для обучения и синтетикой можно погеренить с наложением шумов

peregrine ★★★★★
()
Последнее исправление: peregrine (всего исправлений: 2)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.