LINUX.ORG.RU

Распознавание цифр с картинки

 


1

2

Есть картинка, которую сфоткали с экрана компа, открыв в редакторе hex. На картинке на белом фоне четко различимы и не сливаются все цифры. Нужно разбить на символы и распознать потом. Есть ли готовый софт под это дело ?

Ответ на: комментарий от Mixa

Заметил, что img2txt более менее но с ошибками распознает фотку hex файла, если сфоткано нормально, не под углом. Но почему-то распознает только первые 8 байт в строках, у hex редакторе пробел побольше между 8 и 8 байт в строках. И вот 2-ые 8 байт не замечает. Под углом небольшим пробовал ему пихнуть, совсем ничего не выдал. А про Tesseract можно поподробнее, что там и как использовать.

user2132 ()
Ответ на: комментарий от Mixa

какие OCR не пробовал

Доверять бинаризацию OCR-ам не стоит. Лучше попробовать самому получить достойный вариант, например так:

gm convert -verbose +dither -colors 2 -normalize input.jpg output.tiff

или так: https://github.com/mauvilsa/imgtxtenh, или даже так: https://github.com/ImageProcessing-ElectronicPublications/aithreshold .

А лишь потом скармливать результат tesseract-у.

anonymous ()