LINUX.ORG.RU

ocr - сукс!

anonymous
()

Мда... Такой четкий текст так криво распознать... Это конечно шедевр...

Orlangoor ★★★★★
()

судя по тому, что заглавные буквы,цифры,скобки,точка не рапознаются - это не подстава.
а вот интересно (если это самописная программа) нейронные сети использовали?

anonymous
()

Хы, только на этой неделе специально прошёлся по всем линуксовым OCR, чтобы узнать, как там с русским :)

Фейк. Смотрим на конец шестой строки снизу, слово "независимми". OCR может налажать с буквой, но пропустить её совсем - это вряд ли.

AP ★★★★★
()
Ответ на: комментарий от anonymous

Да, я когда посмотрел на threshold values и количество ошибок тоже сразу подумал о самописной АНН:)

anonymous
()

Похоже на фейк в стиле the bat for linux.

Davidov ★★★★
()
Ответ на: комментарий от AP

> Хы, только на этой неделе специально прошёлся по всем линуксовым OCR, чтобы узнать, как там с русским :)

По всем двум? :)
В любом случае, если считать, что это не подделка, то тогда это точно не известное.

> Смотрим на конец шестой строки снизу, слово "независимми". OCR может налажать с буквой, но пропустить её совсем - это вряд ли.

Вполне возможно, хотя странно, конечно...

Ну вот, потпустил туману... :)

syomin
() автор топика
Ответ на: комментарий от syomin

в вашем профиле указано, что создаете темы в среднем раза 4 в год. одной из них (год назад) был вопрос на тему ocr. за год можно было вполне написать программу с таким качеством распознавания. так что, похоже, не фейк.
дык, это - вы скажите - многослойный персептрон с градиентными извращениями, самоорганизация или признаковый распознаватель ?

anonymous
()
Ответ на: комментарий от AP

> Фейк. Смотрим на конец шестой строки снизу, слово "независимми". OCR может налажать с буквой, но пропустить её совсем - это вряд ли
ага, в одном случае связка "ка" распознается как "кя", а во всех других как "ка". похоже на опечатку при наборе.

anonymous
()
Ответ на: комментарий от anonymous

> в вашем профиле указано, что создаете темы в среднем раза 4 в год.
> одной из них (год назад) был вопрос на тему ocr. за год можно было
> вполне написать программу с таким качеством распознавания. так что,
> похоже, не фейк.
> дык, это - вы скажите - многослойный персептрон с градиентными
> извращениями, самоорганизация или признаковый распознаватель ?

Вам нужно в милиции работать :)

syomin
() автор топика
Ответ на: комментарий от syomin

>> Хы, только на этой неделе специально прошёлся по всем линуксовым OCR, чтобы узнать, как там с русским:-)

> По всем двум?

Эк Вы, батенька, плохо считать умеете :)

1. ClaraOCR
2. gocr и ещё расширение hocr (Hebrew OCR)
3. ocrad
4. Kognition

AP ★★★★★
()

Да, ну когда путь к этому orc : ~/Projects/ocr/tools/orc, то интересно, чьи это Projects? )

anonymous
()

не верю, хотя хочется чтобы это было правдой

da_fault
()

GTК от КрасноШляпы - убожество. Аж передернуло от отвращения.

anonymous
()
Ответ на: комментарий от anonymous

> значит, я прав?
> просто интересно - я тоже ocr интересуюсь. может это - скооперируемся?

Скорее всего да :)
А кооперация имеет смысл только в случае если проект будет под GPL/LGPL - а тут, увы, не всё от меня зависит.

syomin
() автор топика
Ответ на: комментарий от syomin

ну как всегда значит. жаль.
но вы потом раскажите, какой классификатор, все-таки использовали? я моро со всякими дополнениями хочу взять (собственно, уже взял). а предвариловку из гокра(gocr) пока беру

anonymous
()

>Скриншот пришлось сделать черно-белым чтобы влезть в ограничение по объёму.

Про JPEG не слышал?

suser
()
Ответ на: комментарий от anonymous

> ну как всегда значит. жаль.
> но вы потом раскажите, какой классификатор, все-таки использовали? я
> моро со всякими дополнениями хочу взять (собственно, уже взял). а
> предвариловку из гокра(gocr) пока беру

Ну почему, как всегда? :) Возможно, что через пару месяцев проект и будет открыт - тут, повторюсь, не всё зависит от меня.

Что касается технических подробностей, то там ничего экстраординарного нет. Если хотите пообщаться, то с удовольствием по почте - давайте свой e-mail.

syomin
() автор топика
Ответ на: комментарий от anonymous

Из того самого gocr, которому движок никак не перепишут, чтобы не надо было отдельно под каждую букву код писать? :)

AP ★★★★★
()
Ответ на: комментарий от anonymous

У меня ровно те же впечатления от результата работы и от бесед с разработчиками этих программ. У Kognition могло быть будущее, поскольку её можно сравнительно легко научить русскому (ClaraOCR тоже можно и это даже делали), но её запустили.

AP ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.