LINUX.ORG.RU

Распознование символов

 


2

2

Кто в теме, подскажите, какие алгоритмы стоит посмотреть для выделения символа из слова и слова из изображения. С учетом того, что символы могут иметь разную высоту/ширину, быть расположены чуть ниже/выше друг друга, слово может иметь форму дуги.

Если делать через окно поиска, то, правильно ли я понимаю последовательность действий -
1. задать начальную ширину-высоту, пройтись по всему изображению, меняя угол поворота окна и пытаясь распознать хоть что-то с заданной ошибкой.
2. изменить размеры окна и повторить 1.

Сложна твоя задача. Однозначного совета, как сделать это ты не получишь. Тот же abby lingvo и то далеко не любой текст распознаёт.

peregrine ★★★★★
()
Ответ на: комментарий от peregrine

я это понимаю, мне нужен список алгоритмов, чтобы не с 0 начинать

pseudo-cat ★★★
() автор топика

Что то ты совсем не то думаешь. Смотри тессеракт и недавно была статья на хабре. Но надо адаптировать к дуге. В любом случае вначале выделение областей

AlexVR ★★★★★
()
Ответ на: комментарий от peregrine

Не, это совсем пздц, разбираться по коду в неизвестной для себя проблеме.

pseudo-cat ★★★
() автор топика
Ответ на: комментарий от pseudo-cat

Вот под свою конкретную задачу и допили, если не хочешь пару-тройку лет на велосипедостроение потратить.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Deathstalker

кроме архиценности никакой другой пользы для меня там нет. Вот вопрос топика -

для выделения символа из слова и слова из изображения

pseudo-cat ★★★
() автор топика
Ответ на: комментарий от Leron

Статья то годная, но некоторым важным для меня вещам там пара абзацев, к примеру, буквально пара слов о выделении символа/части символа из строки(конец 4 секции) -

бла бла бла, не копируется, ищите вертикальный минимум, подробнее в секции 10

В секции 10 упоминают про сканирование линией, что вообще никак не решает проблему выделения символа из строки и непонятно что делать с наклонными и неровными строками.

pseudo-cat ★★★
() автор топика
Ответ на: комментарий от Deleted

интерполяция в смысле аппроксимация входных символов на набор данных для обучения системы? Это сделал. Осталась задача сегментации строк/слов/символов.

pseudo-cat ★★★
() автор топика

Кстати, может кто-то подскажет - есть ли готовые свободные выборки для обучения, наподобие словаря - изображение символа = символ?

pseudo-cat ★★★
() автор топика
Ответ на: комментарий от Leron

то что надо, просто и понятно! вот так бы всегда отвечали здесь)!

pseudo-cat ★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.