LINUX.ORG.RU

Tesseract 3.00 — новая версия ПО для оптического распознавания текста

 , ,


0

1

Программисты компании Google выпустили третью версию Tesseract, системы оптического распознавания текста.

В новой версии добавлена поддержка множества языков, включая русский.

В числе прочих изменений:

  • добавлен новый модуль анализа структуры документа;
  • добавлена поддержка формата HOCR;
  • библиотека Leptonica стала основной для работы с изображениями;
  • переписан код для работы с неоднозначно распознанными символами;
  • удалена поддержка VC++6.

Загрузить можно здесь.

>>> Подробности



Проверено: isden ()
Последнее исправление: MuZHiK-2 (всего исправлений: 5)

Ответ на: комментарий от xintrea

Для сравнения, Файнридер 8 (2005 год, если чо) распознал эту картинку как:

> большого ума не надо. Предлагаю повесить это вместо новостной ленты на главной странице ЛОРа. Шрифтом 72. Да, насчет ума - соберите хотя бы ... гном, чтоб безглючно работал. Без jhbuild и пр., разумеется - только кучка tar.bz2

petrosyan ★★★★★
()
Ответ на: комментарий от petrosyan

И cuneiform:

болз у надо Предлагаю повесить эзо вместо новостной ленты на славнои странице ЛОРа. Шрифтом 72 Да, наснез ума - соберите хотя бы . сном, чтоб безслюнно работал Без ~Поппе и пр, разумееуся - только кунка tBttlz2

petrosyan ★★★★★
()
Ответ на: комментарий от petrosyan

>славнои странице

cuneiform прославляет ЛОР!

Ttt ☆☆☆☆☆
()

офигенная штука. как я раньше о ней то не слышал. А то вылеты и ошибки «курить бамбук» в cuneilinux уже задолбали.

terminat0r
()
Ответ на: комментарий от petrosyan

> Для сравнения, Файнридер 8 (2005 год, если чо) распознал эту картинку как:

А сабж-то как распознал?

hobbit ★★★★★
()
Ответ на: комментарий от terminat0r

>офигенная штука

так лучше...

gImageReader (A graphical GTK frontend to tesseract-ocr) http://sourceforge.net/projects/gimagereader/

или

Tesseract-gui (Tessract-GUI is not a front-end for tesseract-ocr. It is just a graphical way to use it with simple image manipulation thru ImageMagick.) http://sourceforge.net/projects/tesseract-gui/

bohm ★★★★★
()
Ответ на: комментарий от plantago

И кстати, чтобы понять, как сделать hOCR — пришлось лезть в исходники

plantago
()
Ответ на: комментарий от petrosyan

>сном, чтоб безслюнно работал Без ~Поппе

Сном не может безслюнно работать без ~Поппе!

massimus ★★★
()

капчу она умеет распознавать?

anonymous
()
Ответ на: комментарий от anonymous

Примитивненько. Для русского нужно допиливать под шрифты и лексику. http://img194.imageshack.us/i/test4tr.png/ http://openpaste.org/en/23474/

Разрешение маловато:

If you want to recognize text with an x-height smaller than about 15 pixels, you should either train it specifically or scale your images before trying to recognize them

AlexVR ★★★★★
()
Ответ на: комментарий от petrosyan

>Finereader

Хоть бы ненароком исходники выпали в сеть. Опенсорсные сейчас не распознавалки, а какая-то мастурбация.

PoMM
()
Ответ на: комментарий от PoMM

И что вам будет с этих исходников ? Вы вообще понимаете, сколько ЛЕТ вам придётся в них разбираться ? У них как-то одна корейская компания купила движок OCR. Так чтобы в нём разобраться несколько программеров этой компании несколько ЛЕТ учились в ABBYY.

Возьмите исходники cuneiform или tesseract сначала, и допилите. Если вам не слабо...

gregg128
() автор топика
Ответ на: комментарий от PoMM

> Хоть бы ненароком исходники выпали в сеть. Опенсорсные сейчас не распознавалки, а какая-то мастурбация.

И что вы с ними будите делать?

namezys ★★★★
()
Ответ на: комментарий от Deleted


Пользователям следует уметь собирать пакеты.


Пациентам кардиологии уметь делать себе аортокоронарное шунтирование, пассажирам самолета освоить хотя бы взлет и посадку, владельцам автомобиля уметь делать капремонт двигателя,...

Ты пользователей с разработчиками и мантейнерами не путаешь, нет?

И ссылку не предписание покажи, где написана такая чушь)

justuser ★★
()
Ответ на: комментарий от justuser

Как хорошему автомобилисту надо уметь мыть автомобиль и менять коврики, так и пользователя надо поддерживать свою систему в порядке. И если для этого требуется собрать пакет, грамотный пользователь это сделает.

Deleted
()
Ответ на: комментарий от Deleted

Ты путаешь понятия пользователь и энтузиаст-любитель. Пользователь, использует систему по прямому назначению, вот ты пользователь ПК, а мать наверное в магазине купил, а если бы был хорошим как ты говоришь пользователем, мог бы и сам спаять, и процессор по спекам интела должен бы был уметь испечь.

justuser ★★
()
Ответ на: комментарий от gregg128

>>Возьмите исходники cuneiform или tesseract сначала, и допилите. Если вам не слабо...

Да куда уж нам до

Программисты компании Google

PoMM
()
Ответ на: комментарий от justuser

Ну ты сравнил, процессор испечь и пакет собрать :-). Собрать один/два пакета, вполне нормально для обслуживание системы. Для этого помощи специалиста не требуется.

Deleted
()
Ответ на: комментарий от Deleted

>Ну ты сравнил, процессор испечь и пакет собрать :-). Собрать один/два пакета, вполне нормально для обслуживание системы. Для этого помощи специалиста не требуется.

Так и пломбу в зуб поставить не сложно, и летчик самолет посадить может легко, привычное и не сложное дело. Только зачем это должны уметь делать пациенты и пассажиры? Точнее в твоей интерпретации им следует это уметь.

justuser ★★
()
Ответ на: комментарий от Deleted

Если ты сантехник, тебе трудно понять электронщика, который не умеет правильно устанавливать унитаз, более того, ты ещё и посмеешься над ним, вот же дебил-то, простейшую вещь не может сделать.

justuser ★★
()

А можно ли Tesseract заставить распознать текст на двух языках? Например, русский текст с англоязычными терминами.

AlexVR ★★★★★
()
Ответ на: комментарий от justuser

> Так и пломбу в зуб поставить не сложно, и летчик самолет посадить может легко, привычное и не сложное дело.

Сложное, для этого недостаточно зайти в вики: http://wiki.debian.org/DebianRussian/DebinstPackages и прочесть. Тут специалист нужен. Так же как и для правки кода нужен программист.

Deleted
()
Ответ на: комментарий от justuser

Верно, тогда можно будет сказать, что электронщик - плохой сантехник. Так же и тут, если пользователь GNU/Linux не может собрать пакет, он плохой пользователь GNU/Linux, но это же не значит, что он идиот или дебил. Я тоже плохой актёр, например, ну и что? :)

Deleted
()
Ответ на: комментарий от Deleted

ГОСТы: ГОСТ Р ИСО/МЭК 12207-99.ГОСТ 34.003-90
Статья в вики: http://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D0%BB%D1%8C%D0%B7%D0%BE%D0%B2%D0%B0...



Пользователь — лицо или организация, которое использует действующую систему для выполнения конкретной функции.

В частности, Пользователь АС — лицо, участвующее в функционировании автоматизированной системы или использующее результаты её функционирования.

Для удобной и эффективной работы создаются языки запросов и интерфейсы пользователя.

Пользователи получают разнообразные виды услуг, предоставляемые прикладными службами. По характеру работы различают отдельных пользователей и рабочие группы.

...

Повторюсь, приведи источник, кроме своего мнения, что пользователь ОС должен (или ему следует) уметь собирать ПО из исходных кодов.

Повторюсь ещё раз, ты путаешь понятия, пользователь и ...(я не умею читать мысли)

justuser ★★
()
Ответ на: комментарий от Deleted

Да почему плохой? Если он слушает музыку, смотри кино и печатает, сканирует документы? ОН просто пользователь, пользователь, пользователь. А ты считаешь, он обязан быть разработчиком, админом и тд.

justuser ★★
()
Ответ на: комментарий от justuser

> Повторюсь, приведи источник, кроме своего мнения, что пользователь ОС должен (или ему следует) уметь собирать ПО из исходных кодов.

Источника нет, его и не должно быть, это всего лишь моё мнение, не стоит рассматривать его как факт, как истинное или ложное.

Deleted
()
Ответ на: комментарий от justuser

Ну сам посуди, вот надо ему распознать текст, ничего сложного, но программы в репозитории нет. Что же ему админа звать или маинтейнеру писать? А о необходиости каждый день компилять что либо речи не идёт.

Deleted
()
Ответ на: комментарий от Deleted

Есть сущности, и есть термины, есть даже стандарты, оговаривающие значение этих терминов и есть мнение одного конкретного человека, что некая сущность, обязана обладать некими, не оговоренными ни в стандарте, ни общепринятыми дополнительными свойствами. Предлагаешь принять твоё мнение? Или ты будешь именовать сущности общепринятыми, и даже стандартизированными терминами и не пытаться наделять их свойствами, которые подходят уже под другой термин, и являются атрибутами других сущностей?)

justuser ★★
()
Ответ на: комментарий от Deleted

>Ну сам посуди, вот надо ему распознать текст, ничего сложного, но программы в репозитории нет. Что же ему админа звать или маинтейнеру писать? А о необходиости каждый день компилять что либо речи не идёт.

Представил девочку, студентку филфака, подрабатывающую секретарем, у нее стоит убунта, она набирает письма, чатится в аське , отвечает по телефону. Оп, попросили распознать текст. Открывает свой любимый интернет, гуглит какое есть ПО для распознавания, ставит git, gcc, что там ещё в терминале, патчит скачанный из гита исходник, т.к. просмотрела багтрекер и выяснила, какие есть незакрытые баги, собирает с нужными опциями дебпакет, ставит его и распознает текст. Так?)

justuser ★★
()
Ответ на: комментарий от justuser

> гуглит какое есть ПО для распознавания, wget http://.../**.tar.gz && apt-get install gcc, что там ещё в терминале, собирает с нужными опциями дебпакет, ставит его и распознает текст.

Ну типа того. А что делать? Выхода два - или сказать, что не умеет или собрать пакет.

Deleted
()
Ответ на: комментарий от justuser

Предалагаю делать какие то разделения между пользователем MS Windows, GNU/Linux и FreeBSD, например. Водитель он тоже водитель, но существует категории водительских прав - A, B, C, D, E, а это значит и квалификация у одной категории не соответствует другой. Так же и тут. Секретарша на FreeBSD или Slackware GNU/Linux и MS Windows, вещи всё таки разные.

Deleted
()
Ответ на: комментарий от Deleted

>Предалагаю делать какие то разделения между пользователем MS Windows, GNU/Linux и FreeBSD, например. Водитель он тоже водитель, но существует категории водительских прав - A, B, C, D, E, а это значит и квалификация у одной категории не соответствует другой. Так же и тут. Секретарша на FreeBSD или Slackware GNU/Linux и MS Windows, вещи всё таки разные.

Тогда и писал бы, пользователь, обладающий навыками по сборке пакетов и администрированию ОС Линукс. Только тогда это уже не пользователь =)

Нет такого деления у секретарей. Вообще забавно бло бы почитать должностную инструкцию пользователя или секретаря, в которой был бы хоть намек на БСДю или работу в терминале, не говоря уже про сборку, пакетирование и установку ПО.

justuser ★★
()
Ответ на: комментарий от justuser

> Тогда и писал бы, пользователь, обладающий навыками по сборке пакетов и администрированию ОС Линукс. Только тогда это уже не пользователь =)

Да, загнул я. А всё потому что я привык себя именовать пользователем и вот сейчас начал судить других по себе.

Deleted
()
Ответ на: комментарий от Deleted

>Да, загнул я. А всё потому что я привык себя именовать пользователем и вот сейчас начал судить других по себе.

Так и я просто юзер, хотя и могу собрать и установить пакет, но если совсем уже никак иначе, и этого от меня никто не потребует, мне просто бывает интересно самому поставить что-то)

justuser ★★
()
Ответ на: комментарий от Deleted

>Во, третий пункт - позвать эникейщика.

ИМХО, самый распространенный и правильный в энтерпрайзе вариант)

justuser ★★
()
Ответ на: комментарий от Ttt

это уже другое :) так намного меньше проблем

dotbg ★★★★
()
Ответ на: комментарий от justuser

>ставит git, gcc, что там ещё в терминале

gcc на юникс-подобных системах должен стоять, git в данном случае не нужен, т.к. архив с исходниками лежит.

патчит скачанный из гита исходник, т.к. просмотрела багтрекер и выяснила, какие есть незакрытые баги


А это тут причём? Это уже более сильное колдунство. Как только что вышедший и никуда не включённый патч можно более лёгким способом наложить, если будет доступен бинарник релиза? Тут бинарный пакет вообще не нужен.

Ttt ☆☆☆☆☆
()
Ответ на: комментарий от Ttt

>gcc на юникс-подобных системах должен стоять, git в данном случае не нужен, т.к. архив с исходниками лежит.

Правильно говоришь, а любая блондинка работающая на компьютере с установленном на нем Линуксом должна уметь найти, скачать, сконпилять, запакетировать по правилам дистрибутива и установить программу. Она же пользователь, значит обязана всё это уметь, иначе никак.

А это тут причём?


Да вот так мне захотелось, чтоб любая блондинка с филфака могла всё это уметь, читай сначала, она пользователь, значит обязана знать, уметь, применять.

justuser ★★
()
Ответ на: комментарий от plantago

>Не работает с новым tesseract

да, уж... жаль.

notesalexp.net есть деб-пакеты tesseract 3

bohm ★★★★★
()
Ответ на: комментарий от justuser

>Правильно говоришь, а любая блондинка работающая на компьютере с установленном на нем Линуксом должна уметь найти, скачать, сконпилять, запакетировать по правилам дистрибутива и установить программу. Она же пользователь, значит обязана всё это уметь, иначе никак.


Да. Открыть README и скопировать оттуда три строчки должен уметь каждый.

Ttt ☆☆☆☆☆
()
Ответ на: комментарий от Ttt

>Да. Открыть README и скопировать оттуда три строчки должен уметь каждый.

Каждый пользователь ПК и ОС? И да, откуда такая уверенность, пруф на кодекс или свод обязательных знаний и умений пользователя ОС покажи, я хочу наконец ознакомиться или это личное мнение?)

justuser ★★
()
Ответ на: комментарий от justuser

А что тогда он должен уметь? Если пользователь хочет, чтобы у него появилась программа, которая выполняет какую-либо функцию, он должен её найти в Интернете, скачать и установить на компьютер. А ты хочешь, чтобы компьютер сам при первой же мысли пользователя нашёл программу, сам скачал её и поставил. Как ты предлагаешь это реализовать? Или может где это уже реализовано?

Ttt ☆☆☆☆☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.