LINUX.ORG.RU

Tesseract 3.00 — новая версия ПО для оптического распознавания текста

 , ,


0

1

Программисты компании Google выпустили третью версию Tesseract, системы оптического распознавания текста.

В новой версии добавлена поддержка множества языков, включая русский.

В числе прочих изменений:

  • добавлен новый модуль анализа структуры документа;
  • добавлена поддержка формата HOCR;
  • библиотека Leptonica стала основной для работы с изображениями;
  • переписан код для работы с неоднозначно распознанными символами;
  • удалена поддержка VC++6.

Загрузить можно здесь.

>>> Подробности



Проверено: isden ()

Ответ на: комментарий от petrosyan

> Это верно. Хотя сейчас набегут красноглазые и начнут уверять, что гуй не нужен.

hot folder средствами системы, и про гуй забываешь. Тащемта, самый логичный способ использования данной софтины. Если стоит задача более-мнее периодического распознавания текста, не вижу смысла в каком-либо интерфейсе.

Gukl ★★ ()
Ответ на: комментарий от AlexVR

С третьей версией не работает. По крайней мере у меня не заработал. Да и убожество это а не гуй, как, впрочем и все остальные существующие на данный момент поделки.

petrosyan ★★★★★ ()
Ответ на: комментарий от Gukl

У тебя есть , допустим, скан газеты: четыре колонки текста, таблицы и иллюстрации. На автомате даже файнридер последних версий на таких сканах не всегда правильно определеят, где текстовые блоки, таблицы, гле иллюстрации, не говоря уже об опенсорсных поделках, которые на таких материалах либо выдают невнятное месиво, либо тупо сегфолтятся. И как ты будешь в консоли делать ручную разметку блоков? При всем моем уважении к командной строке, работа с графикой в консоли - это жуткое извращение.

petrosyan ★★★★★ ()
Ответ на: комментарий от px

>А в случае удаления ты сам ошметки вычищать будешь, оставшиеся после make uninstall?

Есть checkinstall, с сабжем работает.

Или зависимости искать


Если тебе дать просто бинарный пакет, то зависимости тоже вручную, возможно, придётся из репозитория ставить.

компилить


Это вообще-то компилятор делает.

ставить


А у нас уже модно ползоваться программами, не требующими установки?

Ttt ☆☆☆☆☆ ()
Ответ на: комментарий от DNA_Seq

>Русский язык есть?

Это уже Ъ², когда даже текст новости не читают.

Ttt ☆☆☆☆☆ ()
Ответ на: комментарий от petrosyan

> работа с графикой в консоли - это жуткое извращение.

Для постоянной рутинной работы - единственный нормальный способ.

У тебя есть , допустим, скан газеты: четыре колонки текста, таблицы и иллюстрации.

Согласен - в таком случае гуй пока нужен.

Gukl ★★ ()
Ответ на: комментарий от gregg128

не тупи, пакет собрать 5 минут делов, не надо быть программером и задротом для этого. нужен деб жди у моря погоды.

bezgubov ()
Ответ на: комментарий от Gukl

>Для постоянной рутинной работы - единственный нормальный способ.

Рисовать тоже в консоли будем? Если там переконыертивовать тиф в пнг, заресайзить пачку картинок или еще что-то простое, то возможно. И то у меня скорее всего будет уже готовый результат с каким-нибудь gthumb'ом, пока ты будешь набирать простыни опций imagemagick (особенно если ты их не помнишь наизусть) и подбирать методом тыка нужные параметры (без превью-то легко не угадать, а если не угадал, то потом все по новой прогонять). В общем на операциях чуть сложнее конвертирования форматов, консоль - это чистейшее ССЗБ.

petrosyan ★★★★★ ()

для тех, кто компилит под x86_64 желательно сделать так: если не указать lib64 оно будет всё в lib скидывать, даже не 64битных хостах..

./configure --prefix=/usr --exec-prefix=/usr --libdir=/usr/lib64
FlameTank ()
Ответ на: комментарий от Quasar

смысл высокооплачиваемых администраторов на предприятии? достаточно его нанять на день, он нарисует архитектуру, и все пользователя настроятся сами. или любой пользователь сможет это нарисовать и никого нанимать не надо.

почему то детей своих ходите лечить к врачам, а что сами не можете? комп более важен чем дети? раз научились его администрировать, а на своего ребенка забили.

или ты можешь с легкостью писать патчи для ядра? или свое разработать? им ведь тоже пользуешься.

а спаять микросхему любой программист сможет?

интересно вот, программистом на месте их работы, платят з/п не выше чем у уборщицы например? ведь в их работе ничего сложного, любой справится.

keinas ()
Ответ на: комментарий от petrosyan

> И то у меня скорее всего будет уже готовый результат с каким-нибудь gthumb'ом, пока ты будешь набирать простыни опций imagemagick

Ну кому-то и фотошоп конвертор. А резултат все равно быстрее получить в консоли, особенно если это «пачка» картинок, а постоянно присылаемые гигабайты картинок. Где-то на тысячной ты нажмешь в в гуе не ту кнопочку и будешь долго материться.

Gukl ★★ ()
Ответ на: комментарий от Ttt

>Если тебе дать просто бинарный пакет, то зависимости тоже вручную, возможно, придётся из репозитория ставить.
Итого считаем. Все что мне придется сделать имея бинарник - это одной командой поставить из репов зависимости. И не надо ничего собирать. Я лично не против компиляния и сборки, но только тогда когда собираю пакеты :) В остальных случаях это засирание системы.

Это вообще-то компилятор делает.

Компилятор компиляет, а пакетный менеджер управляет софтом - все очевидно.

Повторюсь. Для тех кто хочет иметь последнюю версию софтины предпочтительнее осилить сборку пакета (и навыки пригодятся), чем напрямую из сырцов.

px ★★★ ()
Ответ на: комментарий от Quasar

> Нормальные _пользователи_ должны уметь работать со своим персональным компьютером и уметь его администрировать - это прямая обязанность всех нормальных пользователей.

Нормальные пользователи тебе ничего не должны :)

Evtomax ()

А я не понял, там поддержка распознавания форматированного текста есть, или всё ещё нету? Вроде судя по чейнджлогам что-то в этом роде появилось, а как заставить выдать что-либо, кроме обычного текста, нигде не написано.

Ttt ☆☆☆☆☆ ()
Ответ на: комментарий от px

>Итого считаем. Все что мне придется сделать имея бинарник - это одной командой поставить из репов зависимости. И не надо ничего собирать. Я лично не против компиляния и сборки, но только тогда когда собираю пакеты :) В остальных случаях это засирание системы.


Ну набрать ./configure && make && sudo make checkinstall намного сложнее, чем sudo dpkg -i ?

Ttt ☆☆☆☆☆ ()

кто-нибудь знает как у него с распознаванием таблиц?

iceberk ()
Ответ на: комментарий от Deleted

>пользователям полезно уметь собирать пакеты

fixed

dotbg ★★★★ ()
Ответ на: комментарий от Quasar

Нормальные _пользователи_ должны уметь работать со своим персональным компьютером и уметь его администрировать - это прямая обязанность всех нормальных пользователей. Хозяин компьютера - его администратор. И никак иначе.

Нормальные едоки должны уметь пахать, сеять пшеницу, убирать её и печь хлеб. Хозяин хлеба — хлебороб. И никак иначе.

Oleaster ★★★ ()
Ответ на: комментарий от KevinDetry

> А ты жри говно и требуй дебов.

Плюсую, жрите говно, в репах арча уже есть 3.00.

pevzi ★★★★★ ()
Ответ на: комментарий от petrosyan

> К тому же речь шла о сборке деб пакетов, а там нужны более сильные колдунства.

По сборке деб-пакетов можно диссертации писать. То ли дело *build'ы...

pevzi ★★★★★ ()
Ответ на: комментарий от r

>Можно узнать какая часть оптики задействована в тессеракте?

Ну так это. Гугл Индиан Форсес. Вы думаете, это там компутер распознает? Неет. Сидит целый плант индусов и глазами щёлкает. По тому и оптическая.

yoghurt ★★★★★ ()
Ответ на: комментарий от Oleaster

Сборка пакета из исходников сопоставима с приготовлением хлеба в хлебопечке, где надо только ингредиенты по рецепту закинуть и нажать на пуск.

Ttt ☆☆☆☆☆ ()
Ответ на: комментарий от Ttt

Если сложность инструмента не способствует более эффективному решению задачи, то эта сложность не нужна. Собрать и установить программу сложнее и затратнее по времени, чем установить пакет.

Evtomax ()
Ответ на: комментарий от Ttt

>Если их нету в репозитории, то и в случае с бинарником без глубокого гугления не обойтись.
Что за чушь? У меня в репах нету плагина G'MIC к гимпу, а он требует libfftw. Но libfftw в репах есть несмотря на твои заявления. Очень редко когда в репе нельзя найти зависимости для какой софтины.

При установке готового пакета (не из репозитория) та же самая проблема будет.

Не будет. yum remove package.rpm --remove-leaves

px ★★★ ()

у меня вопрос по теме. хочу распознать тысячу анкеток, с заранее определённой формой бланка, где нарисованы квадратики для галочек и решётки для вписывания слов по буквам. с помощью какого свободного ПО можно сделать подобное?

boo32 ()

Либо это чудо пока плохо с русским работает, либо оно плохо с FreeType шрифтами.

P.S. Сканировать было лень, поэтому я напечатал и сделал скриншот.

BratSinot ()
Ответ на: комментарий от Ttt

Зависит от хлеба. Если хлеб по принципу KISS, то просто. Если большой и толстый, то придется попотеть.

anonymous ()

Пару месяцев назад же в Google Docs появился OCR. Наверняка на основе этой хрени. Если так - у нее должны быть очень неплохие возможности.

Однако до конечной программы далеко даже не из-за отсутствия GUI, а хотя бы потому что нужно что-то, что корректно обрабатывает результаты OCR в структуру документа. Иначе получается мусор, с которым невозможно работать, если текста больше 5-10 страниц.

NoMad ★★ ()

> В новой версии добавлена поддержка множества языков, включая русский.

Ну и как там, сегфолт убрали, когда распознается ноль вместо буквы «о»?

xintrea ()
Ответ на: комментарий от Yareg

>годное сравнение Tesseract vs. Cuneiform

Так проверял/сравнивал ли кто-нибудь один и тот же скан.текст в этих прогах? Что можете сказать? Заранее благодарен.

p.s. Не встречали деб-пакет Tesseract 3.0?

bohm ★★★★★ ()
Ответ на: комментарий от anonymous

Га-га! А потом поставь его другу, ога :)

Тут кто-то вопрос задавал про таблица, я его поддержу, а оно это умеет?

Бо КуняАйфарм в этом плане никакой.

anonymous ()
Ответ на: комментарий от xintrea

Это всё ШГ. Если точнее, то, скорее всего, низкое разрешение. Отсканированный текст распознаёт лучше.

Ttt ☆☆☆☆☆ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.