А как сделано распознавание букв?

0

1

Простой вопрос для спв: вот есть программы, которые распознают текст с фотографии. А как они это делают? Есть ли у них база с примерами циферок и букв, написанных разным почерком, или там хитрючие алгоритмы и машинное обучение? Если это база, то насколько она большая? Кто-нибудь её видел?

Ссылка

← И это считается уберпроцессором?

Угадай по фото →

В гугле забанили? просто загугли OCR, контента до вечера хватит

jeuta ★★★★
(08.02.20 07:36:42 MSK)

Ссылка

Вкратце: итак и так.

next_time ★★★★★
(08.02.20 11:26:49 MSK)

Ссылка

Если это база, то насколько она большая?

Примеры буквобаз © (wikipedia.org).

quickquest ★★★★★
(08.02.20 12:29:46 MSK)

Ссылка

Ммм… Спасибо, посмотрел и погуглил.

~~Knigochey~~ ★
(08.02.20 13:29:33 MSK) автор топика

Ссылка

tesseract ocr можешь глянуть. Там и базы есть. Кратко - нейронные сетки.

turtle_bazon ★★★★★
(08.02.20 20:26:19 MSK)

https://github.com/tesseract-ocr/tesseract

vasya_pupkin ★★★★★
(08.02.20 21:00:54 MSK)

Ссылка

http://www-e.uni-magdeburg.de/jschulen/ocr/download.html — самая маленькая из работоспособных. Только печатный латинский шрифт. 430к в TGZ.

https://launchpad.net/cuneiform-linux — 25M, не было релизов 8 лет, но распознаёт гораздо лучше, есть печатный русский.

question4 ★★★★★
(08.02.20 21:58:23 MSK)
Последнее исправление: question4 08.02.20 21:59:06 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от turtle_bazon 08.02.20 20:26:19 MSK

Кратко - нейронные сетки

Спорный вопрос. Хотя - судя по качеству работы…

Например у него какие-то проблемы с black и white листами символов. Что ты их установил, что нет - одновалентно в 99.(9)% случаев. Как в принципе и с туевой хучей настроек, которые очевидны на первый взгляд, но практически результата применения не заметно.

HIS
(21.02.20 23:11:47 MSK)
Последнее исправление: HIS 21.02.20 23:14:51 MSK (всего исправлений: 1)

Ссылка

ML намазан во все поля. При том в несколько этапов, а не просто на картинку посмотреть. тексты для обучения и синтетикой можно погеренить с наложением шумов

peregrine ★★★★★
(21.02.20 23:14:58 MSK)
Последнее исправление: peregrine 21.02.20 23:20:44 MSK (всего исправлений: 2)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← И это считается уберпроцессором?

Talks

Угадай по фото →

Похожие темы