LINUX.ORG.RU

Сообщения gregg128

 

Tesseract 3.00 — новая версия ПО для оптического распознавания текста

Группа Open Source

Программисты компании Google выпустили третью версию Tesseract, системы оптического распознавания текста.

В новой версии добавлена поддержка множества языков, включая русский.

В числе прочих изменений:

  • добавлен новый модуль анализа структуры документа;
  • добавлена поддержка формата HOCR;
  • библиотека Leptonica стала основной для работы с изображениями;
  • переписан код для работы с неоднозначно распознанными символами;
  • удалена поддержка VC++6.

Загрузить можно здесь.

>>> Подробности

 , ,

gregg128 ()

RSS подписка на новые темы