Ocr

5

0

Всего сообщений: 12

Nougat: Neural Optical Understanding for Academic Documents

Компания Meta опубликовала на Github исходный код ПО, ориентированного на обработку научных документов.

Как правило, научные знания хранятся в книгах и научных журналах, часто в формате PDF. Однако формат PDF приводит к потере семантической информации, особенно в отношении математических выражений. В связи с этим предложено использование модели Nougat (Neural Optical Understanding for Academic Documents), основанной на технологии Visual Transformer, которая выполняет задачу оптического распознавания символов (OCR) для преобразования научных документов в язык разметки LaTeX.

Предложенный подход обещает стать перспективным решением для повышения доступности научных знаний в цифровую эпоху.

Исходный код распространяется по лицензии MIT, обученная модель — по CC-BY-NC.

Попробовать можно здесь.

>>> Подробности

computer vision, facebook, latex, ocr

~~evgeny_aa~~
(03.09.23 13:11:48 MSK)

58 комментариев (стр. 2)

Выпуск веб-приложения для работы с отсканированными документами paperless-ngx 1.8.0

Paperless-ngx — веб-приложение для работы с документами, которое преобразует бумажные документы в электронные, доступные для полнотекстового поиска, скачивания и хранения онлайн.

Paperless-ngx — это ответвление от проекта paperless-ng (который, в свою очередь, является ответвлением оригинального проекта paperlsess), представляет собой веб-приложение на базе Python-фреймворка Django. После загрузки отсканированного документа любым доступным способом (по FTP, через веб-интерфейс, через Android приложение, по электронной почте через IMAP), программа осуществляет OCR, используя движок Tesseract, далее в интерфейсе доступно тегирование, поиск, а также скачивание PDF/A версии документа.

В новой версии:

Скрипты пре/пост обработки используют переменные окружения вместо аргументов командной строки.
Миниатюры в веб-интерфейсе переведены в формат WebP вместо PNG.
Настройки веб-интерфейса сохраняются в базе данных.
При смене языка документа в интерфейсе появляется подсказка о необходимости перезагрузить страницу.
При возникновении ошибки связи с Redis показывается более подробная информация.
В веб-интерфейсе добавлена возможность просмотра очереди документов на обработку.
Прочие улучшения и исправления ошибок.

Посмотреть демоверсию можно на https://demo.paperless-ngx.com, логин/пароль demo/demo.

>>> Подробности

django, ocr, pdf, tesseract

DoTheGNU
(30.07.22 10:33:44 MSK)

19 комментариев

Системы оптического распознавания текста в Linux - обзор и сравнительное тестирование

В статье проведено сравнительное тестирование имеющихся систем оптического распознавания текста (OCR), доступных в Linux. Для полноты картины рассматривались как локально устанавливаемые программы, так и онлайновые сервисы. Вывод автора: При хорошем качестве распознаваемого материала все участвовавшие в тестировании программы обеспечивают высокое качество распознавания, причем снижение разрешения с 300 до 200 dpi практически не влияет на результат. В целом можно отметить, что широко распространенное суждение о том, что для Linux нет хороших систем оптического распознавания текста, сегодня уже не выдерживает критики.

>>> Подробности

cuneiform, finereader, ocr, tesseract

vikos
(14.04.11 00:30:35 MSK)

114 комментариев (стр. 2 3)

Tesseract 3.00 — новая версия ПО для оптического распознавания текста

Программисты компании Google выпустили третью версию Tesseract, системы оптического распознавания текста.

В новой версии добавлена поддержка множества языков, включая русский.

В числе прочих изменений:

добавлен новый модуль анализа структуры документа;
добавлена поддержка формата HOCR;
библиотека Leptonica стала основной для работы с изображениями;
переписан код для работы с неоднозначно распознанными символами;
удалена поддержка VC++6.

Загрузить можно здесь.

>>> Подробности

google, ocr, tesseract

gregg128
(05.10.10 14:28:53 MSD)

163 комментария (стр. 2 3 4)

Cuneiform 1.0

Вышла первая стабильная версия системы распознавания текста Cuneiform для платформы Linux. В новой версии проведена большая работа по исправлению ошибок и чистке исходных текстов, что дало разработчикам основание полагать о стабилизации кодовой базы проекта. Код Cuneiform для Linux распространяется под упрощенной лицензией BSD и основан на коде, открытом компанией Cognitive Technologies в 2007 году.

OCR Cuneiform может распознавать любые полиграфические и машинописные гарнитуры всех начертаний, а также шрифты, получаемые с принтеров, за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий, факсов и машинописи. Поддерживается более 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в форматах HTML, hOCR, RTF или PDF с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).

>>> Подробности (opennet)

cuneiform, ocr

renat_gar
(02.07.10 22:15:21 MSD)

89 комментариев (стр. 2)

Вышла новая версия ABBYY FineReader Engine для Linux

Компания ABBYY объявляет о выходе ABBYY FineReader Engine 9.0 for Linux, новой версии инструментария разработчика (SDK), предназначенного для встраивания функций оптического распознавания в приложения независимых производителей. Инструментарий сопровождается подробной документацией, имеет квалифицированную техническую поддержку (в том числе на русском языке), постоянно обновляется.

Среди ключевых возможностей ABBYY FineReader Engine 9.0 for Linux:

Поддержка множества языков
Технология адаптивного распознавания документов (ADRT)
Точное распознавание штрихкодов
Возможность конвертации файлов формата PDF или PDF/A с MRC-сжатием
Поддержка множества форматов (PDF, BMP, PCX, DCX, JPEG, GIF, TIFF и PNG. Сохранение можно производить в RTF, PDF, PDF/A, DOC, XLS, PPT, XML, DOCX, XLSX, PPTX, TXT, CSV, HTML и DBF).

Сайт ABBYY

>>> Подробности

abbyy, ocr

amorpher
(22.04.10 13:59:32 MSD)

194 комментария (стр. 2 3 4)

Cuneiform-Qt — графический интерфейс к Cuneiform

Вышла версия 0.1.1 программы Cuneiform-Qt — графического интерфейса к программе распознавания текстов Cuneiform — лучшей на сегодня из свободных программ OCR под Линукс.

Интерфейс использует библиотеку Qt4. Пока программа работает только с файлами изображений и не умеет взаимодействовать с SANE.

Автор — Андрей Черепанов, участник команды Alt Linux.

Сообщение в блоге автора

Исходный текст

>>> Страница программы

cuneiform, ocr

question4
(08.04.09 14:40:57 MSD)

207 комментариев (стр. 2 3 4 5)

WeOCR 0.12

Вышла новая версия основанной на Web системы оптического распознавания символов (OCR).

Интерес представляет не столько новая версия, сколько сама организация этой системы. WeOCR не содержит собственного OCR-движка и является лишь платформой. Вместо этого, она предназначена для размещения различных систем распознавания символов. Выглядит это следующим образом: пользователь отправляет требующий распознания документ серверу WeOCR и получает обратно результат.

WeOCR предусматривает упрощeнный интерфейс, чтобы как можно большее количество людей смогли легко им воспользоваться.

Разработчики сообщают, что хотя некоторые будут беспокоиться о конфиденциальной информации, содержащейся в их документах, есть ещё много документов, конфиденциальность которых не имеет значения. Они надеются, что WeOCR позволит расширить спектр OCR-приложений.

Кроме того, 15 августа вышла новая версия ещё одного продукта этих разработчиков — Reading Assistant.

Это простая в использовании программа для оказания помощи людям с нарушением зрения. Программа фиксирует изображение при помощи камеры USB 2.0 с высокой разрешающей способностью, распознает символы в текст используя OCR движок и производит текстовый вывод. Пока что текущая версия не оснащена голосовым синтезатором. Пользователь должен сам перевести текст в речь.

>>> Подробности

ocr, web

Bod
(20.08.08 10:11:15 MSD)

20 комментариев

Cuneiform Linux 0.3

Продолжается работа по адаптации OCR-движка Cuneinform к POSIX-совместимым системам. В новой версии Юсси Пакканен добавил поддержку 64-битных систем, а также возможность экспортировать в HTML результаты распознавания текста, включая жирные и курсивные выделения.

Исходные коды доступны по адресу: https://launchpad.net/cuneiform-linux...

>>> Подробности

cuneinform, ocr

Loh
(17.08.08 20:39:55 MSD)

44 комментария

Начато портирование OCR CuneiForm под Linux

Начато портирование OCR CuneiForm под Linux. Пока версия имеет статус альфы под номером 0.1, в которой не все функции работоспособны. Проекту требуется поддержка гуру в C и C++.

>>> Подробности

cuneiform, ocr

~~marazmatik~~
(16.07.08 17:20:27 MSD)

147 комментариев (стр. 2 3)

Он-лайн OCR от Cognitive Technologies

В рамках программы по развитию доступной OCR-системы, как и было обещано ранее, на сервере OpenOCR.org запущена онлайн-служба распознавания символов, работающая на движке CuneiForm.

>>> Подробности

cuneiform, ocr

temarez
(18.06.08 20:29:38 MSD)

22 комментария

Открыт код ядра системы распознавания текстов Cuneiform

Компания Cognitive Technologies объявила об открытии кода ядра системы распознавания печатных текстов Cuneiform. Скачать архив с исходными текстами можно отсюда (37 Мб). В настоящий момент для сборки требуется Microsoft Visual C++ версии 6.0 или новее. Для распространения программы выбрана собственная, но BSD-подобная лицензия (Berkeley Software Distribution). Сама программа Cuneiform Master v.12 остаётся под закрытой лицензией, хотя и бесплатной и по-прежнему доступной: http://www.cuneiform.ru/downl... (34 Мб)

На текущий момент заявку на участие в проекте уже подали более 30 человек из разных стран мира. В планах на 2008 г. подготовка первой версии OCR с открытым кодом на базе Cuneiform, при разработке которой приоритетными направлениями будут: создание современного интерфейса, поддержка Linux и добавление новых языков распознавания.

отредактировано anonymouse_incognito

>>> Подробности

cuneiform, ocr

bochs
(02.04.08 19:58:39 MSD)

142 комментария (стр. 2 3)