LINUX.ORG.RU

LOCR по-русски!


0

0

Вчера скачал два OCR. LOCR позволяет настраивать символы, т.е., в принципе, можно загнать русский. Что-то получалось, надо работать дальше. Проблема - Ы. Ы всегда рассматривается как два символа. Будет хороший русский шаблон - выложу.

>>> LOCR с латинским шаблоном

Неплохо было бы в подобных новостях писать вкратце что такое этот LOCR и с чем его едят. А то "позволяет настраивать символы" слишком расплывчатое определение.

anonymous
()

Ну, в общем, неплохо бы.

Gm
()

Optical Character Recognition или что-то в таком духе :) как я понял это что-то из области Finereader/... под linux?

anonymous
()

Да, этой штуке до FR как до Китая раком. Работает безобразно. Даже на алфу не тянет.

Trupp
()

GOCR с латиницей работает получше, там я тоже что-то типа базы данных символов видел, но вряд ли пахать будет также хорошо. Там осн принцип - количество крестиков, кружочков в букве. А здесь проще: генерируешь шаблон, генерируешь dat-файл и все. Интерфейс приделать - пара пустяков. Проблема - низкое качество, даже латиницы. Надо решать. Неплохой шаблончик для работы. Посмотрю. Единственное - я ненавижу С (ну ничего, переведу на нужный язык). Меня эти *charы с case и с выделениме памяти где не надо уже достали.

FoodTechnologist
() автор топика

Да это же и не OCR вовсе!

Короче, эта хрень вытаскивает текст из PS. Убирает теги, которые лапками вписаны. Такой документации у буржуев до хренищи, и ее надо приводить в более удобочитаемый вид.

Trupp
()

А может лучше писать программу распознавания текстов с 
использованием нейронных сетей?
Работать будет быстрее и обучить разным алфавитам пожалуй легче
будет.

pandrey ★★
()

2pandrey: только не для этой архитектуры. посмотрел я тут давеча как FineReader 5 Pro распознаёт рукописный текст.... не думал, что всё так плохо... :-((

anonymous
()

Кстати, SNNS как нефиг делать будет прикрутить - API есть, хидеры - тоже.И не надо на С гнать - где надо, выделяешь, где не надо, убиваешь... И вообще, нафига тебе строки? :)))))))))))

Shadow ★★★★★
()
Ответ на: комментарий от Shadow

Прикручивать нужно рейтинг букв. Он будет добавляться/вычитаться
к/из дистанции.
Плюс: Ы=Ь+I А далее - простая замена.
Перевод с С - 70 %.
УУх, ужасный язык. Плюс при компиляции тормозит.
Думаю, выложу нечто после 9 мая.

FoodTechnologist
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.