LINUX.ORG.RU

Ocr


5

0

Всего сообщений: 12

Nougat: Neural Optical Understanding for Academic Documents

 , , ,

Группа Open Source

Компания Meta опубликовала на Github исходный код ПО, ориентированного на обработку научных документов.

Как правило, научные знания хранятся в книгах и научных журналах, часто в формате PDF. Однако формат PDF приводит к потере семантической информации, особенно в отношении математических выражений. В связи с этим предложено использование модели Nougat (Neural Optical Understanding for Academic Documents), основанной на технологии Visual Transformer, которая выполняет задачу оптического распознавания символов (OCR) для преобразования научных документов в язык разметки LaTeX.

Предложенный подход обещает стать перспективным решением для повышения доступности научных знаний в цифровую эпоху.

Исходный код распространяется по лицензии MIT, обученная модель — по CC-BY-NC.

Попробовать можно здесь.

>>> Подробности (facebookresearch.github.io)

evgeny_aa
()

Выпуск веб-приложения для работы с отсканированными документами paperless-ngx 1.8.0

 , , ,

Группа Open Source

Paperless-ngx — веб-приложение для работы с документами, которое преобразует бумажные документы в электронные, доступные для полнотекстового поиска, скачивания и хранения онлайн.

Paperless-ngx — это ответвление от проекта paperless-ng (который, в свою очередь, является ответвлением оригинального проекта paperlsess), представляет собой веб-приложение на базе Python-фреймворка Django. После загрузки отсканированного документа любым доступным способом (по FTP, через веб-интерфейс, через Android приложение, по электронной почте через IMAP), программа осуществляет OCR, используя движок Tesseract, далее в интерфейсе доступно тегирование, поиск, а также скачивание PDF/A версии документа.

В новой версии:

  • Скрипты пре/пост обработки используют переменные окружения вместо аргументов командной строки.
  • Миниатюры в веб-интерфейсе переведены в формат WebP вместо PNG.
  • Настройки веб-интерфейса сохраняются в базе данных.
  • При смене языка документа в интерфейсе появляется подсказка о необходимости перезагрузить страницу.
  • При возникновении ошибки связи с Redis показывается более подробная информация.
  • В веб-интерфейсе добавлена возможность просмотра очереди документов на обработку.
  • Прочие улучшения и исправления ошибок.

Посмотреть демоверсию можно на https://demo.paperless-ngx.com, логин/пароль demo/demo.

>>> Подробности (github.com)

DoTheGNU
()

Системы оптического распознавания текста в Linux - обзор и сравнительное тестирование

 , , ,

Группа Open Source

В статье проведено сравнительное тестирование имеющихся систем оптического распознавания текста (OCR), доступных в Linux. Для полноты картины рассматривались как локально устанавливаемые программы, так и онлайновые сервисы. Вывод автора: При хорошем качестве распознаваемого материала все участвовавшие в тестировании программы обеспечивают высокое качество распознавания, причем снижение разрешения с 300 до 200 dpi практически не влияет на результат. В целом можно отметить, что широко распространенное суждение о том, что для Linux нет хороших систем оптического распознавания текста, сегодня уже не выдерживает критики.

>>> Подробности (rus-linux.net)

vikos
()

Tesseract 3.00 — новая версия ПО для оптического распознавания текста

 , ,

Группа Open Source

Программисты компании Google выпустили третью версию Tesseract, системы оптического распознавания текста.

В новой версии добавлена поддержка множества языков, включая русский.

В числе прочих изменений:

  • добавлен новый модуль анализа структуры документа;
  • добавлена поддержка формата HOCR;
  • библиотека Leptonica стала основной для работы с изображениями;
  • переписан код для работы с неоднозначно распознанными символами;
  • удалена поддержка VC++6.

Загрузить можно здесь.

>>> Подробности (google.com)

gregg128
()

Cuneiform 1.0

 ,

Группа Open Source

Вышла первая стабильная версия системы распознавания текста Cuneiform для платформы Linux. В новой версии проведена большая работа по исправлению ошибок и чистке исходных текстов, что дало разработчикам основание полагать о стабилизации кодовой базы проекта. Код Cuneiform для Linux распространяется под упрощенной лицензией BSD и основан на коде, открытом компанией Cognitive Technologies в 2007 году.

OCR Cuneiform может распознавать любые полиграфические и машинописные гарнитуры всех начертаний, а также шрифты, получаемые с принтеров, за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий, факсов и машинописи. Поддерживается более 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в форматах HTML, hOCR, RTF или PDF с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).

>>> Подробности (opennet) (launchpad.net)

renat_gar
()

Вышла новая версия ABBYY FineReader Engine для Linux

 ,

Группа Проприетарное ПО

Компания ABBYY объявляет о выходе ABBYY FineReader Engine 9.0 for Linux, новой версии инструментария разработчика (SDK), предназначенного для встраивания функций оптического распознавания в приложения независимых производителей. Инструментарий сопровождается подробной документацией, имеет квалифицированную техническую поддержку (в том числе на русском языке), постоянно обновляется.

Среди ключевых возможностей ABBYY FineReader Engine 9.0 for Linux:

  • Поддержка множества языков
  • Технология адаптивного распознавания документов (ADRT)
  • Точное распознавание штрихкодов
  • Возможность конвертации файлов формата PDF или PDF/A с MRC-сжатием
  • Поддержка множества форматов (PDF, BMP, PCX, DCX, JPEG, GIF, TIFF и PNG. Сохранение можно производить в RTF, PDF, PDF/A, DOC, XLS, PPT, XML, DOCX, XLSX, PPTX, TXT, CSV, HTML и DBF).

Сайт ABBYY

>>> Подробности (ferra.ru)

amorpher
()

Cuneiform-Qt — графический интерфейс к Cuneiform

 ,

Группа Open Source

Вышла версия 0.1.1 программы Cuneiform-Qt — графического интерфейса к программе распознавания текстов Cuneiform — лучшей на сегодня из свободных программ OCR под Линукс.

Интерфейс использует библиотеку Qt4. Пока программа работает только с файлами изображений и не умеет взаимодействовать с SANE.

Автор — Андрей Черепанов, участник команды Alt Linux.

Сообщение в блоге автора

Исходный текст

>>> Страница программы (altlinux.org)

question4
()

WeOCR 0.12

 ,

Группа Linux General

Вышла новая версия основанной на Web системы оптического распознавания символов (OCR).

Интерес представляет не столько новая версия, сколько сама организация этой системы. WeOCR не содержит собственного OCR-движка и является лишь платформой. Вместо этого, она предназначена для размещения различных систем распознавания символов. Выглядит это следующим образом: пользователь отправляет требующий распознания документ серверу WeOCR и получает обратно результат.

WeOCR предусматривает упрощeнный интерфейс, чтобы как можно большее количество людей смогли легко им воспользоваться.

Разработчики сообщают, что хотя некоторые будут беспокоиться о конфиденциальной информации, содержащейся в их документах, есть ещё много документов, конфиденциальность которых не имеет значения. Они надеются, что WeOCR позволит расширить спектр OCR-приложений.

Кроме того, 15 августа вышла новая версия ещё одного продукта этих разработчиков — Reading Assistant.

Это простая в использовании программа для оказания помощи людям с нарушением зрения. Программа фиксирует изображение при помощи камеры USB 2.0 с высокой разрешающей способностью, распознает символы в текст используя OCR движок и производит текстовый вывод. Пока что текущая версия не оснащена голосовым синтезатором. Пользователь должен сам перевести текст в речь.

>>> Подробности (ocrgrid.org)

Bod
()

Cuneiform Linux 0.3

 cuneinform,

Группа Open Source

Продолжается работа по адаптации OCR-движка Cuneinform к POSIX-совместимым системам. В новой версии Юсси Пакканен добавил поддержку 64-битных систем, а также возможность экспортировать в HTML результаты распознавания текста, включая жирные и курсивные выделения.

Исходные коды доступны по адресу: https://launchpad.net/cuneiform-linux...

>>> Подробности (google.com)

Loh
()

Начато портирование OCR CuneiForm под Linux

 ,

Группа Linux General

Начато портирование OCR CuneiForm под Linux. Пока версия имеет статус альфы под номером 0.1, в которой не все функции работоспособны. Проекту требуется поддержка гуру в C и C++.

>>> Подробности (launchpad.net)

marazmatik
()

Он-лайн OCR от Cognitive Technologies

 ,

Группа Open Source

В рамках программы по развитию доступной OCR-системы, как и было обещано ранее, на сервере OpenOCR.org запущена онлайн-служба распознавания символов, работающая на движке CuneiForm.

>>> Подробности (openocr.org)

temarez
()

Открыт код ядра системы распознавания текстов Cuneiform

 ,

Группа Open Source

Компания Cognitive Technologies объявила об открытии кода ядра системы распознавания печатных текстов Cuneiform. Скачать архив с исходными текстами можно отсюда (37 Мб). В настоящий момент для сборки требуется Microsoft Visual C++ версии 6.0 или новее. Для распространения программы выбрана собственная, но BSD-подобная лицензия (Berkeley Software Distribution). Сама программа Cuneiform Master v.12 остаётся под закрытой лицензией, хотя и бесплатной и по-прежнему доступной: http://www.cuneiform.ru/downl... (34 Мб)

На текущий момент заявку на участие в проекте уже подали более 30 человек из разных стран мира. В планах на 2008 г. подготовка первой версии OCR с открытым кодом на базе Cuneiform, при разработке которой приоритетными направлениями будут: создание современного интерфейса, поддержка Linux и добавление новых языков распознавания.

отредактировано anonymouse_incognito

>>> Подробности (cuneiform.ru)

bochs
()