Ocr

5

0

Всего сообщений: 12

Nougat: Neural Optical Understanding for Academic Documents

Компания Meta опубликовала на Github исходный код ПО, ориентированного на обработку научных документов.

Как правило, научные знания хранятся в книгах и научных журналах, часто в формате PDF. Однако формат PDF приводит к потере семантической информации, особенно в отношении математических выражений. В связи с этим предложено использование модели Nougat (Neural Optical Understanding for Academic Documents), основанной на технологии Visual Transformer, которая выполняет задачу оптического распознавания символов (OCR) для преобразования научных документов в язык разметки LaTeX.

Предложенный подход обещает стать перспективным решением для повышения доступности научных знаний в цифровую эпоху.

Исходный код распространяется по лицензии MIT, обученная модель — по CC-BY-NC.

Попробовать можно здесь.

>>> Подробности (facebookresearch.github.io)

~~evgeny_aa~~
(03.09.23 13:11:48 MSK)

58 комментариев (стр. 2)

Новости — Open Source

Выпуск веб-приложения для работы с отсканированными документами paperless-ngx 1.8.0

django, ocr, pdf, tesseract

Paperless-ngx — веб-приложение для работы с документами, которое преобразует бумажные документы в электронные, доступные для полнотекстового поиска, скачивания и хранения онлайн.

Paperless-ngx — это ответвление от проекта paperless-ng (который, в свою очередь, является ответвлением оригинального проекта paperlsess), представляет собой веб-приложение на базе Python-фреймворка Django. После загрузки отсканированного документа любым доступным способом (по FTP, через веб-интерфейс, через Android приложение, по электронной почте через IMAP), программа осуществляет OCR, используя движок Tesseract, далее в интерфейсе доступно тегирование, поиск, а также скачивание PDF/A версии документа.

В новой версии:

Скрипты пре/пост обработки используют переменные окружения вместо аргументов командной строки.
Миниатюры в веб-интерфейсе переведены в формат WebP вместо PNG.
Настройки веб-интерфейса сохраняются в базе данных.
При смене языка документа в интерфейсе появляется подсказка о необходимости перезагрузить страницу.
При возникновении ошибки связи с Redis показывается более подробная информация.
В веб-интерфейсе добавлена возможность просмотра очереди документов на обработку.
Прочие улучшения и исправления ошибок.

Посмотреть демоверсию можно на https://demo.paperless-ngx.com, логин/пароль demo/demo.

>>> Подробности (github.com)

DoTheGNU
(30.07.22 10:33:44 MSK)

19 комментариев

Новости — Open Source

Системы оптического распознавания текста в Linux - обзор и сравнительное тестирование

cuneiform, finereader, ocr, tesseract

В статье проведено сравнительное тестирование имеющихся систем оптического распознавания текста (OCR), доступных в Linux. Для полноты картины рассматривались как локально устанавливаемые программы, так и онлайновые сервисы. Вывод автора: При хорошем качестве распознаваемого материала все участвовавшие в тестировании программы обеспечивают высокое качество распознавания, причем снижение разрешения с 300 до 200 dpi практически не влияет на результат. В целом можно отметить, что широко распространенное суждение о том, что для Linux нет хороших систем оптического распознавания текста, сегодня уже не выдерживает критики.

>>> Подробности (rus-linux.net)

vikos
(14.04.11 00:30:35 MSK)

114 комментариев (стр. 2 3)

Новости — Open Source

Tesseract 3.00 — новая версия ПО для оптического распознавания текста

google, ocr, tesseract

Программисты компании Google выпустили третью версию Tesseract, системы оптического распознавания текста.

В новой версии добавлена поддержка множества языков, включая русский.

В числе прочих изменений:

добавлен новый модуль анализа структуры документа;
добавлена поддержка формата HOCR;
библиотека Leptonica стала основной для работы с изображениями;
переписан код для работы с неоднозначно распознанными символами;
удалена поддержка VC++6.

Загрузить можно здесь.

>>> Подробности (google.com)

gregg128
(05.10.10 14:28:53 MSK)

163 комментария (стр. 2 3 4)

Новости — Open Source

Cuneiform 1.0

cuneiform, ocr

Вышла первая стабильная версия системы распознавания текста Cuneiform для платформы Linux. В новой версии проведена большая работа по исправлению ошибок и чистке исходных текстов, что дало разработчикам основание полагать о стабилизации кодовой базы проекта. Код Cuneiform для Linux распространяется под упрощенной лицензией BSD и основан на коде, открытом компанией Cognitive Technologies в 2007 году.

OCR Cuneiform может распознавать любые полиграфические и машинописные гарнитуры всех начертаний, а также шрифты, получаемые с принтеров, за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий, факсов и машинописи. Поддерживается более 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в форматах HTML, hOCR, RTF или PDF с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).

>>> Подробности (opennet) (launchpad.net)

renat_gar
(02.07.10 22:15:21 MSK)

89 комментариев (стр. 2)

Новости — Проприетарное ПО

Вышла новая версия ABBYY FineReader Engine для Linux

abbyy, ocr

Компания ABBYY объявляет о выходе ABBYY FineReader Engine 9.0 for Linux, новой версии инструментария разработчика (SDK), предназначенного для встраивания функций оптического распознавания в приложения независимых производителей. Инструментарий сопровождается подробной документацией, имеет квалифицированную техническую поддержку (в том числе на русском языке), постоянно обновляется.

Среди ключевых возможностей ABBYY FineReader Engine 9.0 for Linux:

Поддержка множества языков
Технология адаптивного распознавания документов (ADRT)
Точное распознавание штрихкодов
Возможность конвертации файлов формата PDF или PDF/A с MRC-сжатием
Поддержка множества форматов (PDF, BMP, PCX, DCX, JPEG, GIF, TIFF и PNG. Сохранение можно производить в RTF, PDF, PDF/A, DOC, XLS, PPT, XML, DOCX, XLSX, PPTX, TXT, CSV, HTML и DBF).

Сайт ABBYY

>>> Подробности (ferra.ru)

amorpher
(22.04.10 13:59:32 MSK)

194 комментария (стр. 2 3 4)

Новости — Open Source

Cuneiform-Qt — графический интерфейс к Cuneiform

cuneiform, ocr

Вышла версия 0.1.1 программы Cuneiform-Qt — графического интерфейса к программе распознавания текстов Cuneiform — лучшей на сегодня из свободных программ OCR под Линукс.

Интерфейс использует библиотеку Qt4. Пока программа работает только с файлами изображений и не умеет взаимодействовать с SANE.

Автор — Андрей Черепанов, участник команды Alt Linux.

Сообщение в блоге автора

Исходный текст

>>> Страница программы (altlinux.org)

question4
(08.04.09 14:40:57 MSK)

207 комментариев (стр. 2 3 4 5)

Новости — Linux General

WeOCR 0.12

ocr, web

Вышла новая версия основанной на Web системы оптического распознавания символов (OCR).

Интерес представляет не столько новая версия, сколько сама организация этой системы. WeOCR не содержит собственного OCR-движка и является лишь платформой. Вместо этого, она предназначена для размещения различных систем распознавания символов. Выглядит это следующим образом: пользователь отправляет требующий распознания документ серверу WeOCR и получает обратно результат.

WeOCR предусматривает упрощeнный интерфейс, чтобы как можно большее количество людей смогли легко им воспользоваться.

Разработчики сообщают, что хотя некоторые будут беспокоиться о конфиденциальной информации, содержащейся в их документах, есть ещё много документов, конфиденциальность которых не имеет значения. Они надеются, что WeOCR позволит расширить спектр OCR-приложений.

Кроме того, 15 августа вышла новая версия ещё одного продукта этих разработчиков — Reading Assistant.

Это простая в использовании программа для оказания помощи людям с нарушением зрения. Программа фиксирует изображение при помощи камеры USB 2.0 с высокой разрешающей способностью, распознает символы в текст используя OCR движок и производит текстовый вывод. Пока что текущая версия не оснащена голосовым синтезатором. Пользователь должен сам перевести текст в речь.

>>> Подробности (ocrgrid.org)

Bod
(20.08.08 10:11:15 MSK)

20 комментариев

Новости — Open Source

Cuneiform Linux 0.3

cuneinform, ocr

Продолжается работа по адаптации OCR-движка Cuneinform к POSIX-совместимым системам. В новой версии Юсси Пакканен добавил поддержку 64-битных систем, а также возможность экспортировать в HTML результаты распознавания текста, включая жирные и курсивные выделения.

Исходные коды доступны по адресу: https://launchpad.net/cuneiform-linux...

>>> Подробности (google.com)

Loh
(17.08.08 20:39:55 MSK)

44 комментария

Новости — Linux General

Начато портирование OCR CuneiForm под Linux

cuneiform, ocr

Начато портирование OCR CuneiForm под Linux. Пока версия имеет статус альфы под номером 0.1, в которой не все функции работоспособны. Проекту требуется поддержка гуру в C и C++.

>>> Подробности (launchpad.net)

~~marazmatik~~
(16.07.08 17:20:27 MSK)

147 комментариев (стр. 2 3)

Новости — Open Source

Он-лайн OCR от Cognitive Technologies

cuneiform, ocr

В рамках программы по развитию доступной OCR-системы, как и было обещано ранее, на сервере OpenOCR.org запущена онлайн-служба распознавания символов, работающая на движке CuneiForm.

>>> Подробности (openocr.org)

temarez
(18.06.08 20:29:38 MSK)

22 комментария

Новости — Open Source

Открыт код ядра системы распознавания текстов Cuneiform

cuneiform, ocr

Компания Cognitive Technologies объявила об открытии кода ядра системы распознавания печатных текстов Cuneiform. Скачать архив с исходными текстами можно отсюда (37 Мб). В настоящий момент для сборки требуется Microsoft Visual C++ версии 6.0 или новее. Для распространения программы выбрана собственная, но BSD-подобная лицензия (Berkeley Software Distribution). Сама программа Cuneiform Master v.12 остаётся под закрытой лицензией, хотя и бесплатной и по-прежнему доступной: http://www.cuneiform.ru/downl... (34 Мб)

На текущий момент заявку на участие в проекте уже подали более 30 человек из разных стран мира. В планах на 2008 г. подготовка первой версии OCR с открытым кодом на базе Cuneiform, при разработке которой приоритетными направлениями будут: создание современного интерфейса, поддержка Linux и добавление новых языков распознавания.

отредактировано anonymouse_incognito

>>> Подробности (cuneiform.ru)

bochs
(02.04.08 19:58:39 MSK)

142 комментария (стр. 2 3)