LINUX.ORG.RU

Cuneiform-Qt — графический интерфейс к Cuneiform

 ,


0

0

Вышла версия 0.1.1 программы Cuneiform-Qt — графического интерфейса к программе распознавания текстов Cuneiform — лучшей на сегодня из свободных программ OCR под Линукс.

Интерфейс использует библиотеку Qt4. Пока программа работает только с файлами изображений и не умеет взаимодействовать с SANE.

Автор — Андрей Черепанов, участник команды Alt Linux.

Сообщение в блоге автора

Исходный текст

>>> Страница программы

★★★★★

Проверено: Dimez ()

Ответ на: комментарий от EmStudio

>Файнридер работает под вайном.

И что теперь, бросить к чертям собачим Cuneiform? Пользуешься FineReader -- пользуйся наздоровье. Почему обязательно нужно прийти, насрать в форум и плюнуть автору в душу?

Demon37 ★★★★
()

Автору можно сказать спасибо и выказать уважение уже лишь за то, что он взялся за такую работу и довёл её до состояния, когда уже можно показать людям. Создание интерфейса - это кропотливая рутинная неинтересная работа, нужны силы, чтобы на подобное тратить свое свободное время за спасибо комьюнити.

Barlog_M
()
Ответ на: комментарий от question4

>> Ну хоть таблицы поддерживаются?

>А поддерживает ли их Cuneiform? Не уверен.

а это не задача Cuneiform-а, если есть морда то морда должна позволить разметить страничку и передать движку с какого по какой диапазон надо распознать, ядро распознает и отдает морде, а та уже сама текст форматирует, зная какое задание было дано движку.

angel_il ★★★★
()

Вот что за люди? Сами палец о палец не ударили, а пришли в треде посрать и в автора поплеваться. Совесть поимейте.
Автор делает не ради бабок, а просто так. За что ему уже большое спасибо.

Mikael
()
Ответ на: комментарий от angel_il

Т.е. задача морды просто отдать движку координаты сектора для распознания. В случае с таблицей таких координат будет несколько в зависимости от того сколько ячеек в таблице

angel_il ★★★★
()
Ответ на: комментарий от EmStudio

> Не успели сделать - полезли пеаритцо.

Ни я, ни Bod к разработке данной программы отношения не имеем. Просто узнали, и захотелось поделиться новостью с окружающими.

question4 ★★★★★
() автор топика
Ответ на: комментарий от EmStudio

> А это разве не *** OFFICIAL CUNEIFORM-QT THREAD ***?

Нет. Хотя автор теперь здесь появился.

question4 ★★★★★
() автор топика
Ответ на: комментарий от Demon37

> Почему обязательно нужно прийти, насрать в форум и плюнуть автору в душу?

Нет, надо делать свои поделки, которые даже на 0.1% не похожи по функционалу на ближайшие коммерческие аналоги, при этом полезть на форумы и блоги и начать ПЕАР

EmStudio
()
Ответ на: комментарий от Barlog_M

> Создание интерфейса - это кропотливая рутинная неинтересная работа, нужны силы, чтобы на подобное тратить свое свободное время за спасибо комьюнити.

Да, но не здесь. Здесь - набросать контролов на форму с 2 окощками - это сильно сложная задача, только титанам посильна.

EmStudio
()

Ебилд для сборки из git

inherit qt4 git

EGIT_REPO_URI="git://git.altlinux.org/people/cas/packages/cuneiform-qt.git"

DESCRIPTION="Qt interface for Cuneiform"
HOMEPAGE="http://www.altlinux.org/Cuneiform-Qt"

LICENSE="GPL-3"
SLOT="0"
KEYWORDS="~amd64 ~x86"
IUSE=""

# Насчёт минимальной версии Qt не уверен
DEPEND=">=x11-libs/qt-4.5"
RDEPEND="${DEPEND}"

src_compile () {
	cd "${S}/cuneiform-qt"
	sed 's/\/share\/apps\/cuneiform-qt\//\/share\/cuneiform-qt\//' -i cuneiform-qt.pro
	PREFIX="/usr" eqmake4
	emake
}

src_install() {
	cd "${S}/cuneiform-qt"
	dodoc AUTHORS README TODO
	INSTALL_ROOT="${D}" emake DESTDIR="${D}" install
}

question4 ★★★★★
() автор топика
Ответ на: комментарий от EmStudio

>при этом полезть на форумы и блоги и начать ПЕАР

Родное сердце, где тут "ПЕАР"? Кстати, если бы не эта новость, я бы был уверен, что нативный Cuneiform вообще мертв.

MageasteR ★★★★★
()
Ответ на: комментарий от angel_il

Именно. Я тоже писал про это. Более того, это позволит распознавать различные врезки с наклонным текстом, заголовки таблиц и прочее нестандартное форматирование.

EmStudio
()
Ответ на: комментарий от GotDotNetMono

Для особо туповдумчивых. Вопрос был "Зачем они нужны?"

MageasteR ★★★★★
()
Ответ на: комментарий от GotDotNetMono

> а зачем вообще нужен Cuneiform?

> 1) форум НЕ работает http://openocr.org/forum/

> 2) сборка под Win НЕ работает

> 3) сборка под Lin НЕ работает.

Документации нету, авторов тоже нету, как оно работает - никто не знает, а кто знает - тот недоступен и занимается чем-то другим.

EmStudio
()
Ответ на: комментарий от question4

последняя обновленная Opensource сборка наконец-то запустилась под Win.

ЭТО КАКОЕ ТО УБОЖЕСТВО!

1) Требуется MS Office(OLE embedded) т.к. ниасилили свой редактор
2) как следствие: юзабилити по нулям - нет 2-сторонней синхронизации "Изображение-Распознанный текст"
3) автораспознавание блоков - ужас! нужно самому все размечать!

И это типа Opensource проект после 2 лет разроботки!

УЖАС!

ПС. А "несвободная версия" от Cognitive была достаточно вменяемой.

GotDotNetMono
()

Для эксперимента попробовал распознать фото объявления на дверях подъезда. Что-то распознать удалось после обработки в GIMP-е (сделал кадрирование, коррекцию перспективы, автоматическое увеличение контраста: http://piccy.info/view/c3cc95bda67e56f6595ee6c61b31c5bd/). Результат:
-----------------------------------------------
УВАЖАЕМЫЕ ЖИЛЬ ЦЬХ!
В связи с капитальным
ремонтом на транзитной
трассе го~ мчей и холодной
ВОДЫ Н3 ЖИЛОМ ДОМ~.'
п . Па ковый 13. 6 д т
И~ БООИ С ВОДОИ ДО
10.12.200Хг.
Извините за доставленные
неудобства.
ООО «Речник-Плюс»
"22б201
-----------------------------------------------

D_V_S
()
Ответ на: комментарий от EmStudio

> Т.е. GTK+ не напрягает, а WINE - напрягает? Несколько странно.

Сколько ресурсов использует один и другой тулкит сами догадаетесь?

Skull ★★★★★
()
Ответ на: комментарий от EmStudio

> Дада, посмотрел. Не успели сделать - полезли пеаритцо.

Во-первых, я сначала закоммитил, а потом написал. Во-вторых, пиарятся на LOR, а я скромно написал в блоге.

Skull ★★★★★
()
Ответ на: комментарий от GotDotNetMono

> И это типа Opensource проект после 2 лет разроботки!

Opensource != "не использует сторонние закрытые библиотеки" :(

И ещё раз: данная новость относится к версии, запускаемой из командной строки, без графического интерфейса. https://launchpad.net/cuneiform-linux

question4 ★★★★★
() автор топика
Ответ на: комментарий от Demon37

> Почему обязательно нужно прийти, насрать в форум и плюнуть автору в душу?

Я уже не первых год на LOR (да и в свободных проектах) и уже не удивляюсь поведению троллей.

Skull ★★★★★
()
Ответ на: комментарий от GotDotNetMono

> Открой для себя Wine!

Открыл. Посмотрел, подумал. Счёл ненужным для распознавания и закрыл.

Skull ★★★★★
()
Ответ на: комментарий от GotDotNetMono

> 3) сборка под Lin НЕ работает.

А у нас в ALT Linux работает (думаю, не только у нас). Что мы делаем не так?

Skull ★★★★★
()
Ответ на: комментарий от question4

а какой смысл имеет OCR без GUI?

90% рапознавания - это сверка неуверенно распознанного текста с оригинальным изображением.

Здесь GUI критически важен.

И не такой какой он сейчас.

GotDotNetMono
()
Ответ на: комментарий от EmStudio

>Здесь - набросать контролов на форму с 2 окощками - это сильно сложная задача, только титанам посильна.


Ну, я вот, к примеру принципиально не пользуюсь консольными приложениями. Потому что набирать вручную какие-то команды почитаю за фгм.
А вот за написанную форму с 2 окошками - автору большое спасибо, теперь можно будет пользоваться. Так что очень даже не лишняя штука.

SplindeR
()
Ответ на: комментарий от GotDotNetMono

> а какой смысл имеет OCR без GUI?

Отсканировал книгу, нарезал страницы в ImageMagic, пропустил через распознаватель. Если сканер нормальный, книгу клал ровно, достаточное разрешение, количество колонок на всех страницах одинаково, и нет ни таблиц, ни картинок, то вычитка почти не требуется.

> 90% рапознавания - это сверка неуверенно распознанного текста с оригинальным изображением. Здесь GUI критически важен. И не такой какой он сейчас.

Открываем 2 окна на пол-экрана каждое: в одном картинка, в другом — редактор с текстом. И обошлись без гуя :)

Конечно, подсветка сомнительного текста и соответствующих мест на изображении полезна. Особенно если нет хорошего сканера и было лень ровно положить книгу :)

question4 ★★★★★
() автор топика

А не легче ли было встроить в виде плагина данный функционал в какой нибуть графический редактор?

Devix
()

Вообще, кому не нравится сабж - напишите свой, лучше. Это и есть OpenSource, обмен идеями. Хватит культивировать потребительский культ.

Hellor
()
Ответ на: комментарий от mamay_cozak

>Нафига графическому редактору распознавать текст?

Ну для того кому нужен GUI, чтобы не писать свой редактор для корекции изображений перед отправкой их в Cuneiform.

Devix
()
Ответ на: комментарий от eugrus

> Не умею пользоваться Гитом. Как скачать?

На первой странице была ссылка со снапшотом. Или брать RPM с ftp.altlinux.org и открывать в mc. У нас же тарболлы формируются автоматически из git посредством gear.

Skull ★★★★★
()
Ответ на: комментарий от eugrus

> Не умею пользоваться Гитом. Как скачать?

На http://git.altlinux.org/people/cas/packages/?p=cuneiform-qt.git;a=summary по ссылкам "snapshot" выдаются срезы в tar.gz. Например: http://git.altlinux.org/people/cas/packages/?p=cuneiform-qt.git;a=snapshot;h=...

question4 ★★★★★
() автор топика
Ответ на: комментарий от EmStudio

> Нет, надо делать свои поделки, которые даже на 0.1% не похожи по функционалу на ближайшие коммерческие аналоги, при этом полезть на форумы и блоги и начать ПЕАР

Долбоящер? Сам хоть что-нибудь полезное сделал в жизни?

shahid ★★★★★
()
Ответ на: комментарий от eugrus

Тем временем у меня проблемы с самим cuneiform:

$ cuneiform cuneiform: error while loading shared libraries: libpuma.so: cannot open shared object file: No such file or directory

Пакет libpuma-dev установлен (Ubuntu 8.10)

eugrus ★★★★★
()

Граждане EmStudio и GotDotNetMono, не рекомендую так себя вести, вы крайне недалеко до бана.

Deleted
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.