LINUX.ORG.RU

Kooka померла? И есть ли аналоги?

 ,


0

1

В своё время был такой проект:

Kooka is an intuitive, easy to use open source GNU/Linux scan program. It is the scan application of choice for the KDE platform and thus it is an official part of the KDE Graphics Package.

Kooka supports GOCR, an open source ocr project. Kooka works with KADMOS, a commercial OCR/ICR toolbox. Kooka interfaces Ocrad, a Free Software OCR program.

Были про него и темы на ЛОРе, правда, все они остались в середине нулевых.

Сейчас в базовом KDE у себя я его не наблюдаю, попытка сделать sudo pacman -S kde-graphics предлагает поставить что угодно, но не сабж.

Всё, проект дохлый? И есть ли современные альтернативы, или всё ценное в консоли?

★★★★★

Ответ на: комментарий от krasnh

Там же одни правки локализации и замена задепрекейченных мелочей на новые. И нет поддержки самых продвинутых свободных OCR - Тессеракта и Кальмаров (ранее известных как Ocropy, Ocropus, Kraken).

Последняя фича - крутилки для параметров GOCR - добавлалась в 2021 году.

token_polyak ★★★★
()
Последнее исправление: token_polyak (всего исправлений: 2)
Ответ на: комментарий от token_polyak

Похоже, её выпилили из AUR. Будем мучать tesseract руками.

Ещё б найти, что в линуксе может сканировать документ на много страниц в один PDF. Сейчас skanlite запустил, но он, похоже, по одному листу сохраняет…

hobbit ★★★★★
() автор топика
Ответ на: комментарий от hobbit

Похоже, её выпилили из AUR.

Наговариваете вы на нашу семью, грех это. (c) gImageReader AUR

Больше и разного, https://wiki.archlinux.org/title/List_of_applications/Documents#OCR_software. Причем Kooka не указана…

krasnh ★★★
()
Последнее исправление: krasnh (всего исправлений: 3)

А задача то какая? Если сканировать, то ничего лучше нормального сканера с автоподачей не придумали. Хотя есть Xsane всякие. Но в любом случае, после скана нужна постобработка типа scan-tailor. А уже полученные изображения можно и через ocr пускать создав pdf или djvu.

einhander ★★★★★
()
Ответ на: комментарий от token_polyak

В общем, попробовал я gImageReader-Qt6. С групповым сохранением в PDF у него проблемы, по одному сохраняет. При распознавании им же через tesseract результат распознавания есть, с большим количеством огрехов.

Далее я для очистки совести попробовал скормить в командной строке tesseract-у с явно указанным языком rus растровую картинку, сохранённую в gImageReader. И вот тут началось самое интересное! Первая и последняя треть листа распознались идеально, без единой ошибки. Зато середины текста нет, как корова языком слизала. При том, что в png-файле изображение текста присутствует полностью и одинакового качества на всех участках.

Со всем этим, конечно, надо будет разбираться. Но вчера я в качестве временной меры отсканировал весь многостраничный материал в PDF. C этим прекрасно справился gscan2pdf, если нужно просто создать многстраничный скан, то эта программа с задачей справляется на твёрдую пятёрку. Потом скормил этот PDF (к счастью, не конфиденциальный) онлайн-сервису https://convertio.co/. Я их попробовал три штуки, этот сервис — единственный, кто честно распознаёт текст (на пятёрку с минусом, я бы сказал) и возвращает его в виде .docx, остальные распробованные просто вставляют в документ картинки. У сервиса ограничение, бесплатно можно отсканировать до 10 листов.

Вот такой вот workaround, подойдёт не для всех задач. На будущее, конечно, надо проблему решать, например, исследовать «интересное» поведение tesseract… Тему решённой пока не помечаю.

hobbit ★★★★★
() автор топика
Последнее исправление: hobbit (всего исправлений: 3)
Ответ на: комментарий от hobbit

В общем да, единственная свободная сюита, в которой я видел большинство необходимого - это монструозный OCR-D, ориентированный на пропуск через пайплайны целых книг. Вот там тебе и предобработка изображения, и нарезка на колонки-абзацы-строки, и распознавание несколькими OCR (а то из тессеракта >=4 вырезали, например, распознавание жирный ли текст или курсивом написан), и вывод в разные форматы - всё в одном.

А сохранять в один PDF gImageReader всё-таки умеет.

token_polyak ★★★★
()
Последнее исправление: token_polyak (всего исправлений: 3)