LINUX.ORG.RU

Cuneiform 1.0

 ,


0

0

Вышла первая стабильная версия системы распознавания текста Cuneiform для платформы Linux. В новой версии проведена большая работа по исправлению ошибок и чистке исходных текстов, что дало разработчикам основание полагать о стабилизации кодовой базы проекта. Код Cuneiform для Linux распространяется под упрощенной лицензией BSD и основан на коде, открытом компанией Cognitive Technologies в 2007 году.

OCR Cuneiform может распознавать любые полиграфические и машинописные гарнитуры всех начертаний, а также шрифты, получаемые с принтеров, за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий, факсов и машинописи. Поддерживается более 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в форматах HTML, hOCR, RTF или PDF с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).

>>> Подробности (opennet)



Проверено: annoynimous ()
Последнее исправление: lodin (всего исправлений: 2)

Ответ на: комментарий от anonymous

>Что в fr9 по сравнению с fr6 изменилось? Ничего, абсолютно.

Внезапно! Кроме русского и английского есть другие языки и с их распознаванием стало гораздо лучше.

petrosyan ★★★★★
()

Собираю посмотреть. Не пользуюсь, но версия красивая :)

fractaler ★★★★★
()
Ответ на: комментарий от Smacker

киньте исходное изображение на багзиллу или лист рассылки.

yaleks
()

Собрал 1.0. Качество распознавания не улучшилось ни на грамм. Вообще не понятно что они там пилят и когда оно будет юзабильно.

petrosyan ★★★★★
()
Ответ на: комментарий от Smacker

Сейчас заметил одну интересную вещь: на скане 300 dpi вместо тире кракозябры, на 600 dpi - тире как и должно быть.

petrosyan ★★★★★
()
Ответ на: комментарий от anonymous

в 8-й версии добавили расправление криворуких фотоснимков - убирает эффект аберрации

очень акутально для быдломыльниц, которые фоткать с зумом при обычном освещении не могут в принципе

anonymous
()
Ответ на: комментарий от nixtrian

>Так мы же не знаем, ЧЕМ оно там распознает, на сайте-то.. может оно всё загруженное файнридеру скармливает?

Да нет, глюки вроде характерные для cuneiform. Может там какая постобработка есть типа замены — на —

petrosyan ★★★★★
()

Жалко нету какого-то одного, центрального сайта где можно скачать все хоть как-то связанные пакеты и документацию по Cuneiform, а то неудобно совсем лазить по десятку разных сайтов в разные концы света.

los_nikos ★★★★★
()
Ответ на: комментарий от petrosyan

Там стоит оригинальная сборка от авторов (там кстати и распознование таблиц есть). В той, что в новости пришлось много чего выкинуть, для того, чтобы скомпилировалось в gcc. Проект стоит потому что нет никаких официальных объяснений/схем/технических проектов, есть только исходники. Может быть когда-нибудь удастся разобраться со структурой исходного проекта и тогда появится весь оригинальный функционал, а потом уже качество распознавания начнёт расти.

in_dance
()

Косая пропри… А, это теперь free software? Ну тогда уважуха и благодарности! Дело нужное.

guitarist ★★
()
Ответ на: комментарий от in_dance

Хорошо, что кто-то пытается разобраться в исходниках, гигантский вам респект и уважуха, ребята! Труд титанический, но можно просто патчи полухакерские какие-то накладывать, местные припарки. Ну а там уже эволцюионно со временем можно разобраться, как оно устроено в целом. В любом случае, то, что за этот тяжёлый и нужный труд взялись всё-таки, внушает оптимизм.

DRVTiny ★★★★★
()
Ответ на: комментарий от Xenius

> Лицензия BSD, говорите? Может они просто себе код заюзали какой-то?

Говорят, алгоритмы принципиально отличаются. И ФР вышел вперёд задолго до открытия.

question4 ★★★★★
()
Ответ на: комментарий от annulen

> по-моему оно ни фига не BSD, а какая-то проприетарщина. На сайте лицензия есть

И ты туда же. А с виду приличный человек :)

На http://cuneiform.ru/ и http://openocr.org/ — версии под Windows. Оригинальная бинарная, и та её часть, которую позволили открыть (без таблиц и ещё чего-то). Бинарная — да, проприетарная. Freeware, но закрытая.

question4 ★★★★★
()

посмотрел в исходники - там проще с нуля переписать чем разгрести кучу недокументированного, виндусявого кода.

qwerky
()
Ответ на: комментарий от petrosyan

petrosyan> У файнридера я насчитал 4 ошибки, три из которых со знаками препинания (одна в кадр не вошла)

У меня файнридер 5 давал результаты повеселее, чем то, что ты показал. Причём при аналогичных условиях распознавания.

Quasar ★★★★★
()
Ответ на: комментарий от petrosyan

Комментарии далеко не излишни. То, что видно на скринах, говорит только о том, что в CF по сути отсутствует постобработка. Если брать те языки, где у FR не очень хорошо со словарями, то качество распознавания у обоих программ примерно одинаковое. Я, правда, сужу не по нынешним сборкам, а по сравнению качества распознавания CF v12 - это то, что открыли, и FR 5 Pro на текстах на польском языке. Распознавал сканы с ксерокопий статей при 300 dpi (текст 12 pt.).

При этом если брать качество распознавания не текста а страницы (макета), то у FR оно лучше, но это скорее проблемы пред- и постобработки.

Кстати, сравнивать корректно желательно версии CF 12 и FR 5, т.к. они одного по сути года выпуска. А ты по сути сравниваешь CF v12 (с тех пор ядро CF не менялось, т.к. разработка была заморожена) и FR далеко не пятой версии.

anonymous
()
Ответ на: комментарий от anonymous

> То, что видно на скринах, говорит только о том, что в CF по сути отсутствует постобработка.

Допустим. И что? Предлагаете каждому юзеру «допилить» постобработку самим?
Я вижу, что _на_данном_тексте_ действительно особых различий в качестве нет, а другие? А тексты с перекосом?

Кстати, сравнивать корректно желательно версии CF 12 и FR 5


С какого перепоя? Мы СЕЙЧАС хотим иметь хорошую программу, не уступающую _современным_ аналогам. То, что кунилинформ провёл последние 8 лет в анабиозе - никого не колышет.

Вообще, работа с распознаванием настолько специфична, что «поиграть в FOSS» тут вряд ли удастся - слишком много требуется сил и мат.аппарата для более-менее вразумительных результатов (какие показывает FR). Не вижу особого смысла тратить силы на Куни - есть море других архиважных задач.

matumba ★★★★★
()

А почему сабж в Debian — non-free?

Снёс проприетарщину.

derrix
()
Ответ на: комментарий от anonymous

> При этом если брать качество распознавания не текста а страницы (макета), то у FR оно лучше, но это скорее проблемы пред- и постобработки.

там много всего

namezys ★★★★
()
Ответ на: комментарий от matumba

Изумительная логика: раз мы хотим иметь хорошую программу для OSR, то надо забросить все работы над единственной программой, какая у нас есть. А Вы диалектик, прямо как Королева в Алисе!

Oleaster ★★★
()

«Гераклам», разгребающим «Авгиевы конюшни», доставшиеся после win-coding — респект и уважуха!
Дай им великий Логос последовательности, да не покинет их муза вдохновения!

Pronin ★★★★
()
Ответ на: комментарий от matumba

> Вообще, работа с распознаванием настолько специфична, что «поиграть в FOSS» тут вряд ли удастся - слишком много требуется сил и мат.аппарата для более-менее вразумительных результатов (какие показывает FR).

Пример OpenCV тебя не вдохновляет почему-то?

Aceler ★★★★★
()

сделал скрин с LOR, оставил только текст.

не распознало вообще ничего. Ей что, черным по белому еще подавай?

anonymous
()
Ответ на: комментарий от anonymous

> сделал скрин с LOR, оставил только текст.

У вас экран с резухой 300dpi?

yaleks
()
Ответ на: комментарий от petrosyan

в основной ветке вообще никаких изменений нет, только чистка кода мелкая.

в ветке https://code.launchpad.net/~serge-uliss/cuneiform-linux/refactoring довольно большие отличия, но она тянет на форк скорее, да и под GPL идет... там есть начальная поддержка экспорта в ODF, но недавно удалили поддержку RTF( зато работает экспорт картинок в PNG и JPG + прога работает под NetBSD...

anonymous
()
Ответ на: комментарий от Aceler

Пример OpenCV тебя не вдохновляет почему-то?


Его даже классический матобес фришный не вдохновляет вроде GSL .

kernel ★★☆
()
Ответ на: комментарий от anonymous

CuneiForm и многостраничные TIFF

Оказывается CuneiForm не работает с многостраничными TIFF :( Проблема встала у меня под оффтоп, поэтому быстро наваял даннй скрипт... да да не ругайте меня на VB.

Скрипт использует ImageMagick для разбивки одного tif на несколько, потом они открываются в CuneiForm последовательно. CuneiForm кстати позволяет добавлять сканы в один документ, так что вроде данная реализация удобна.

Вот код скрипта:

' Made by Mrakus (c) 2010
' GPL v. 2.0

IM = "C:\Progra~1\Cognitive\ImageMagick"
CuneiForm  = "C:\Progra~1\Cognitive\CuneiForm"

Dim FSO, Folder
set FSO=CreateObject("Scripting.FileSystemObject")

Set objDialog = CreateObject("SAFRCFileDlg.FileOpen")
If objDialog.OpenFileOpenDlg then
	tempdir = CreateObject("WScript.Shell").ExpandEnvironmentStrings("%Temp%")
	data = date()
	tempdir = tempdir & "\" & data
	newname = FSO.GetTempName
	Set objFolder = FSO.CreateFolder(tempdir)
	FSO.CopyFile objDialog.FileName , IM & "\" & newname
   Set shell = CreateObject("WScript.Shell")
	shell.CurrentDirectory = IM
   err = shell.Run("convert " & newname & " " & tempdir & "\single%d.tif", 1, True)
   FSO.DeleteFile IM & "\" & newname
   If err = 0 then
		shell.CurrentDirectory = CuneiForm
		Set myFolder = fso.GetFolder(tempdir)
		Set myFiles = myFolder.Files
		For Each myFile In myFiles
			err = shell.Run("face " & tempdir & "\" & myFile.Name, 1, True )
		Next
   End if                                             
   FSO.DeleteFolder(tempdir)
End if
'   	WScript.Echo "OK"

anonymous
()
Ответ на: комментарий от petrosyan

«Стоит сейчас 0.9 что-то там. Качество распознавания паршивое, даже до уровня fr6 не дотягивает. Если они к 1.0 только код чистили, как написано в новости, то не думаю, что что-то всерьез изменилось. Полного чейнджлога нигде не найти.»

Это не правда - качество распознавание отличное - проблема разметкой графики и таблиц. Надо в ручную размечать или он начинает путаться.

anonymous
()
Ответ на: комментарий от anonymous

16 градаций для него оптимальны вроде а вовсе не 2.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.