Cuneiform 1.0

0

0

Вышла первая стабильная версия системы распознавания текста Cuneiform для платформы Linux. В новой версии проведена большая работа по исправлению ошибок и чистке исходных текстов, что дало разработчикам основание полагать о стабилизации кодовой базы проекта. Код Cuneiform для Linux распространяется под упрощенной лицензией BSD и основан на коде, открытом компанией Cognitive Technologies в 2007 году.

OCR Cuneiform может распознавать любые полиграфические и машинописные гарнитуры всех начертаний, а также шрифты, получаемые с принтеров, за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий, факсов и машинописи. Поддерживается более 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в форматах HTML, hOCR, RTF или PDF с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).

>>> Подробности (opennet)

Ссылка

←	YouTube не будет отказываться от Flash

Релиз libjpeg-turbo 1.0.0

→

← 1 2 →

Ответ на: комментарий от anonymous 03.07.10 08:44:31 MSD

>Что в fr9 по сравнению с fr6 изменилось? Ничего, абсолютно.

Внезапно! Кроме русского и английского есть другие языки и с их распознаванием стало гораздо лучше.

petrosyan ★★★★★
(03.07.10 11:57:15 MSD)

Ссылка

Собираю посмотреть. Не пользуюсь, но версия красивая :)

fractaler ★★★★★
(03.07.10 12:06:14 MSD)

Ссылка

Ответ на: комментарий от Smacker 03.07.10 04:33:07 MSD

киньте исходное изображение на багзиллу или лист рассылки.

yaleks
(03.07.10 12:27:01 MSD)

Ссылка

Собрал 1.0. Качество распознавания не улучшилось ни на грамм. Вообще не понятно что они там пилят и когда оно будет юзабильно.

petrosyan ★★★★★
(03.07.10 12:43:13 MSD)

Ответ на: комментарий от Smacker 03.07.10 04:33:07 MSD

Сейчас заметил одну интересную вещь: на скане 300 dpi вместо тире кракозябры, на 600 dpi - тире как и должно быть.

petrosyan ★★★★★
(03.07.10 12:57:23 MSD)

Ссылка

Ответ на: комментарий от valich 02.07.10 23:27:30 MSD

>где пакеты для хомячков?

http://notesalexp.org/

хорошая OCR, под линукс работающих альтернатив пока нет. ФР пусть идет в топку, хоть и лучше работает...

bohm ★★★★★
(03.07.10 13:04:39 MSD)

Пакеты для Fedora, Mandriva, OpenSUSE:
http://download.opensuse.org/repositories/home:/TI_Eugene/

TI_Eugene ★★
(03.07.10 13:13:59 MSD)

Ссылка

Ответ на: комментарий от anonymous 03.07.10 08:44:31 MSD

в 8-й версии добавили расправление криворуких фотоснимков - убирает эффект аберрации

очень акутально для быдломыльниц, которые фоткать с зумом при обычном освещении не могут в принципе

anonymous
(03.07.10 13:27:11 MSD)

Ссылка

Ответ на: комментарий от bohm 03.07.10 13:04:39 MSD

>> где пакеты для хомячков?

http://notesalexp.org/

Вот спасибо! А то непорядок...

valich ★★★
(03.07.10 13:42:37 MSD)

Ссылка

http://cunewebform.nntc.nnov.ru/

Во как! Странно, но оно распознает немного лучше чем offline версия

petrosyan ★★★★★
(03.07.10 13:52:31 MSD)

Ответ на: комментарий от petrosyan 03.07.10 13:52:31 MSD

Так мы же не знаем, ЧЕМ оно там распознает, на сайте-то.. может оно всё загруженное файнридеру скармливает?

nixtrian ★
(03.07.10 14:18:57 MSD)

Ответ на: комментарий от nixtrian 03.07.10 14:18:57 MSD

>Так мы же не знаем, ЧЕМ оно там распознает, на сайте-то.. может оно всё загруженное файнридеру скармливает?

Да нет, глюки вроде характерные для cuneiform. Может там какая постобработка есть типа замены вЂ” на —

petrosyan ★★★★★
(03.07.10 14:50:29 MSD)

Жалко нету какого-то одного, центрального сайта где можно скачать все хоть как-то связанные пакеты и документацию по Cuneiform, а то неудобно совсем лазить по десятку разных сайтов в разные концы света.

los_nikos ★★★★★
(03.07.10 14:52:13 MSD)

Ссылка

Ответ на: комментарий от petrosyan 03.07.10 14:50:29 MSD

Там стоит оригинальная сборка от авторов (там кстати и распознование таблиц есть). В той, что в новости пришлось много чего выкинуть, для того, чтобы скомпилировалось в gcc. Проект стоит потому что нет никаких официальных объяснений/схем/технических проектов, есть только исходники. Может быть когда-нибудь удастся разобраться со структурой исходного проекта и тогда появится весь оригинальный функционал, а потом уже качество распознавания начнёт расти.

~~in_dance~~ ★
(03.07.10 15:19:59 MSD)

Ответ на: комментарий от in_dance 03.07.10 15:19:59 MSD

Это imho, разумеется.

~~in_dance~~ ★
(03.07.10 15:33:34 MSD)

Ссылка

Косая пропри… А, это теперь free software? Ну тогда уважуха и благодарности! Дело нужное.

guitarist ★★
(03.07.10 15:41:30 MSD)

Ссылка

Ответ на: комментарий от in_dance 03.07.10 15:19:59 MSD

Хорошо, что кто-то пытается разобраться в исходниках, гигантский вам респект и уважуха, ребята! Труд титанический, но можно просто патчи полухакерские какие-то накладывать, местные припарки. Ну а там уже эволцюионно со временем можно разобраться, как оно устроено в целом. В любом случае, то, что за этот тяжёлый и нужный труд взялись всё-таки, внушает оптимизм.

DRVTiny ★★★★★
(03.07.10 17:39:15 MSD)

Ссылка

Ответ на: комментарий от nixtrian 03.07.10 14:18:57 MSD

> Так мы же не знаем, ЧЕМ оно там распознает, на сайте-то.. может оно всё загруженное файнридеру скармливает?

http://fireforge.net/projects/cunewebform/

Aceler ★★★★★
(03.07.10 18:22:54 MSD)

Ссылка

Ответ на: комментарий от Xenius 02.07.10 23:21:11 MSD

> Лицензия BSD, говорите? Может они просто себе код заюзали какой-то?

Говорят, алгоритмы принципиально отличаются. И ФР вышел вперёд задолго до открытия.

question4 ★★★★★
(03.07.10 19:00:36 MSD)

Ссылка

Ответ на: комментарий от annulen 03.07.10 02:09:26 MSD

> по-моему оно ни фига не BSD, а какая-то проприетарщина. На сайте лицензия есть

И ты туда же. А с виду приличный человек :)

На http://cuneiform.ru/ и http://openocr.org/ — версии под Windows. Оригинальная бинарная, и та её часть, которую позволили открыть (без таблиц и ещё чего-то). Бинарная — да, проприетарная. Freeware, но закрытая.

question4 ★★★★★
(03.07.10 19:00:47 MSD)

Ссылка

посмотрел в исходники - там проще с нуля переписать чем разгрести кучу недокументированного, виндусявого кода.

qwerky ★
(03.07.10 19:50:54 MSD)

Ссылка

Ответ на: комментарий от petrosyan 03.07.10 00:45:19 MSD

petrosyan> У файнридера я насчитал 4 ошибки, три из которых со знаками препинания (одна в кадр не вошла)

У меня файнридер 5 давал результаты повеселее, чем то, что ты показал. Причём при аналогичных условиях распознавания.

~~Quasar~~ ★★★★★
(03.07.10 20:10:59 MSD)

Ссылка

Ответ на: комментарий от petrosyan 03.07.10 00:45:19 MSD

Комментарии далеко не излишни. То, что видно на скринах, говорит только о том, что в CF по сути отсутствует постобработка. Если брать те языки, где у FR не очень хорошо со словарями, то качество распознавания у обоих программ примерно одинаковое. Я, правда, сужу не по нынешним сборкам, а по сравнению качества распознавания CF v12 - это то, что открыли, и FR 5 Pro на текстах на польском языке. Распознавал сканы с ксерокопий статей при 300 dpi (текст 12 pt.).

При этом если брать качество распознавания не текста а страницы (макета), то у FR оно лучше, но это скорее проблемы пред- и постобработки.

Кстати, сравнивать корректно желательно версии CF 12 и FR 5, т.к. они одного по сути года выпуска. А ты по сути сравниваешь CF v12 (с тех пор ядро CF не менялось, т.к. разработка была заморожена) и FR далеко не пятой версии.

anonymous
(03.07.10 21:56:42 MSD)

Ответ на: комментарий от anonymous 03.07.10 21:56:42 MSD

> То, что видно на скринах, говорит только о том, что в CF по сути отсутствует постобработка.

Допустим. И что? Предлагаете каждому юзеру «допилить» постобработку самим?
Я вижу, что _на_данном_тексте_ действительно особых различий в качестве нет, а другие? А тексты с перекосом?

Кстати, сравнивать корректно желательно версии CF 12 и FR 5

С какого перепоя? Мы СЕЙЧАС хотим иметь хорошую программу, не уступающую _современным_ аналогам. То, что кунилинформ провёл последние 8 лет в анабиозе - никого не колышет.

Вообще, работа с распознаванием настолько специфична, что «поиграть в FOSS» тут вряд ли удастся - слишком много требуется сил и мат.аппарата для более-менее вразумительных результатов (какие показывает FR). Не вижу особого смысла тратить силы на Куни - есть море других архиважных задач.

matumba ★★★★★
(03.07.10 23:11:22 MSD)

А почему сабж в Debian — non-free?

Снёс проприетарщину.

derrix
(03.07.10 23:59:35 MSD)

Ссылка

Ответ на: комментарий от anonymous 03.07.10 21:56:42 MSD

> При этом если брать качество распознавания не текста а страницы (макета), то у FR оно лучше, но это скорее проблемы пред- и постобработки.

там много всего

namezys ★★★★
(04.07.10 00:08:31 MSD)

Ссылка

Ответ на: комментарий от matumba 03.07.10 23:11:22 MSD

Изумительная логика: раз мы хотим иметь хорошую программу для OSR, то надо забросить все работы над единственной программой, какая у нас есть. А Вы диалектик, прямо как Королева в Алисе!

~~Oleaster~~ ★★★
(04.07.10 03:48:21 MSD)

Ссылка

«Гераклам», разгребающим «Авгиевы конюшни», доставшиеся после win-coding — респект и уважуха!
Дай им великий Логос последовательности, да не покинет их муза вдохновения!

Pronin ★★★★
(04.07.10 12:25:34 MSD)

Ссылка

Ответ на: комментарий от matumba 03.07.10 23:11:22 MSD

> Вообще, работа с распознаванием настолько специфична, что «поиграть в FOSS» тут вряд ли удастся - слишком много требуется сил и мат.аппарата для более-менее вразумительных результатов (какие показывает FR).

Пример OpenCV тебя не вдохновляет почему-то?

Aceler ★★★★★
(04.07.10 12:34:18 MSD)

Ответ на: комментарий от bohm 03.07.10 13:04:39 MSD

вай спасибо

anonymous
(04.07.10 12:35:36 MSD)

Ссылка

А вот интересно, туда код из http://symmetrica.net/cuneiform-linux/ никто не втягивал ?..

AS ★★★★★
(04.07.10 13:55:23 MSD)

Ссылка

сделал скрин с LOR, оставил только текст.

не распознало вообще ничего. Ей что, черным по белому еще подавай?

anonymous
(04.07.10 15:43:39 MSD)

Ответ на: комментарий от anonymous 04.07.10 15:43:39 MSD

> сделал скрин с LOR, оставил только текст.

У вас экран с резухой 300dpi?

yaleks
(04.07.10 15:55:36 MSD)

Ссылка

Ответ на: комментарий от petrosyan 03.07.10 12:43:13 MSD

в основной ветке вообще никаких изменений нет, только чистка кода мелкая.

в ветке https://code.launchpad.net/~serge-uliss/cuneiform-linux/refactoring довольно большие отличия, но она тянет на форк скорее, да и под GPL идет... там есть начальная поддержка экспорта в ODF, но недавно удалили поддержку RTF( зато работает экспорт картинок в PNG и JPG + прога работает под NetBSD...

anonymous
(04.07.10 16:41:52 MSD)

Ссылка

Ответ на: комментарий от Aceler 04.07.10 12:34:18 MSD

Пример OpenCV тебя не вдохновляет почему-то?

Его даже классический матобес фришный не вдохновляет вроде GSL .

kernel ★★☆
(05.07.10 00:57:22 MSD)

Ссылка

Ответ на: комментарий от petrosyan 03.07.10 00:45:19 MSD

o_О у него есть кнопки... Надо еще разок попробовать...

anonymous
(05.07.10 18:46:59 MSD)

Ответ на: комментарий от anonymous 05.07.10 18:46:59 MSD

CuneiForm и многостраничные TIFF

Оказывается CuneiForm не работает с многостраничными TIFF :( Проблема встала у меня под оффтоп, поэтому быстро наваял даннй скрипт... да да не ругайте меня на VB.

Скрипт использует ImageMagick для разбивки одного tif на несколько, потом они открываются в CuneiForm последовательно. CuneiForm кстати позволяет добавлять сканы в один документ, так что вроде данная реализация удобна.

Вот код скрипта:

' Made by Mrakus (c) 2010
' GPL v. 2.0

IM = "C:\Progra~1\Cognitive\ImageMagick"
CuneiForm  = "C:\Progra~1\Cognitive\CuneiForm"

Dim FSO, Folder
set FSO=CreateObject("Scripting.FileSystemObject")

Set objDialog = CreateObject("SAFRCFileDlg.FileOpen")
If objDialog.OpenFileOpenDlg then
	tempdir = CreateObject("WScript.Shell").ExpandEnvironmentStrings("%Temp%")
	data = date()
	tempdir = tempdir & "\" & data
	newname = FSO.GetTempName
	Set objFolder = FSO.CreateFolder(tempdir)
	FSO.CopyFile objDialog.FileName , IM & "\" & newname
   Set shell = CreateObject("WScript.Shell")
	shell.CurrentDirectory = IM
   err = shell.Run("convert " & newname & " " & tempdir & "\single%d.tif", 1, True)
   FSO.DeleteFile IM & "\" & newname
   If err = 0 then
		shell.CurrentDirectory = CuneiForm
		Set myFolder = fso.GetFolder(tempdir)
		Set myFiles = myFolder.Files
		For Each myFile In myFiles
			err = shell.Run("face " & tempdir & "\" & myFile.Name, 1, True )
		Next
   End if                                             
   FSO.DeleteFolder(tempdir)
End if
'   	WScript.Echo "OK"

anonymous
(07.07.10 15:22:10 MSD)

Ссылка

Ответ на: комментарий от petrosyan 02.07.10 17:18:06 MSD

«Стоит сейчас 0.9 что-то там. Качество распознавания паршивое, даже до уровня fr6 не дотягивает. Если они к 1.0 только код чистили, как написано в новости, то не думаю, что что-то всерьез изменилось. Полного чейнджлога нигде не найти.»

Это не правда - качество распознавание отличное - проблема разметкой графики и таблиц. Надо в ручную размечать или он начинает путаться.

anonymous
(09.07.10 12:13:37 MSD)

Ответ на: комментарий от anonymous 09.07.10 12:13:37 MSD

16 градаций для него оптимальны вроде а вовсе не 2.

anonymous
(09.07.10 13:11:43 MSD)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

←	YouTube не будет отказываться от Flash

Open Source

Релиз libjpeg-turbo 1.0.0

→

А почему сабж в Debian — non-free?

CuneiForm и многостраничные TIFF

Похожие темы