Kooka померла? И есть ли аналоги?

0

1

Kooka is an intuitive, easy to use open source GNU/Linux scan program. It is the scan application of choice for the KDE platform and thus it is an official part of the KDE Graphics Package.

Kooka supports GOCR, an open source ocr project. Kooka works with KADMOS, a commercial OCR/ICR toolbox. Kooka interfaces Ocrad, a Free Software OCR program.

Были про него и темы на ЛОРе, правда, все они остались в середине нулевых.

Сейчас в базовом KDE у себя я его не наблюдаю, попытка сделать sudo pacman -S kde-graphics предлагает поставить что угодно, но не сабж.

Всё, проект дохлый? И есть ли современные альтернативы, или всё ценное в консоли?

Ссылка

← не скачивается линукс (openSUSE)

Пауза перед запуском некоторого софта →

Судя по коммитам, вещь пилится в режиме реального времени https://github.com/KDE/kooka.

krasnh ★★★★★
(15.06.23 20:55:43 MSK)

Ответ на: комментарий от krasnh 15.06.23 20:55:43 MSK

Там же одни правки локализации и замена задепрекейченных мелочей на новые. И нет поддержки самых продвинутых свободных OCR - Тессеракта и Кальмаров (ранее известных как Ocropy, Ocropus, Kraken).

Последняя фича - крутилки для параметров GOCR - добавлалась в 2021 году.

token_polyak ★★★★★
(15.06.23 20:57:55 MSK)
Последнее исправление: token_polyak 15.06.23 21:01:21 MSK (всего исправлений: 2)

есть ли современные альтернативы

gImageReader?

token_polyak ★★★★★
(15.06.23 21:03:44 MSK)

я вообще о такой не слышал. Все время использовал только scan2pdf. Кстати очень неплохая вещь

~~monkdt~~
(15.06.23 21:12:50 MSK)

Ссылка

Я в те времена xsane пользовался

annulen ★★★★★
(15.06.23 21:14:15 MSK)

Ссылка

Ответ на: комментарий от token_polyak 15.06.23 21:03:44 MSK

Похоже, её выпилили из AUR. Будем мучать tesseract руками.

Ещё б найти, что в линуксе может сканировать документ на много страниц в один PDF. Сейчас skanlite запустил, но он, похоже, по одному листу сохраняет…

hobbit ★★★★★
(15.06.23 21:28:09 MSK) автор топика

https://apps.kde.org/skanlite/

ааааа, тут ещё ocr нужен

grem ★★★★★
(15.06.23 21:28:49 MSK)
Последнее исправление: grem 15.06.23 21:29:57 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от token_polyak 15.06.23 20:57:55 MSK

Логотип у кальмаров, конечно, мощный.

Mobutu_Sese_Seko ★★
(15.06.23 21:31:09 MSK)

Ссылка

Ответ на: комментарий от hobbit 15.06.23 21:28:09 MSK

Для мультистраничноно сканирования есть какой-то https://invent.kde.org/utilities/skanpage

grem ★★★★★
(15.06.23 21:31:54 MSK)

Ссылка

Ответ на: комментарий от hobbit 15.06.23 21:28:09 MSK

Похоже, её выпилили из AUR.

Наговариваете вы на нашу семью, грех это. (c) gImageReader AUR

Больше и разного, https://wiki.archlinux.org/title/List_of_applications/Documents#OCR_software. Причем Kooka не указана…

krasnh ★★★★★
(15.06.23 21:34:00 MSK)
Последнее исправление: krasnh 15.06.23 21:38:05 MSK (всего исправлений: 3)

кроме gscan2pdf попробовал сейчас naps2 который рекомендуют. Тоже работает неплохо

Важная тема

~~monkdt~~
(15.06.23 21:34:17 MSK)

Ссылка

Ответ на: комментарий от hobbit 15.06.23 21:28:09 MSK

Да что вы говорите, он не то что в AUR, он в репе extra лежит.

token_polyak ★★★★★
(15.06.23 21:47:16 MSK)

Ссылка

Ответ на: комментарий от krasnh 15.06.23 21:34:00 MSK

Ах да, получается, надо было указать суффикс — gtk или qt.

hobbit ★★★★★
(15.06.23 22:27:30 MSK) автор топика

Ответ на: комментарий от hobbit 15.06.23 22:27:30 MSK

Только сейчас заметил, писал про «AUR», а ссылку дал на «Packages» (Repository: Extra).

krasnh ★★★★★
(15.06.23 22:42:19 MSK)

Ссылка

А задача то какая? Если сканировать, то ничего лучше нормального сканера с автоподачей не придумали. Хотя есть Xsane всякие. Но в любом случае, после скана нужна постобработка типа scan-tailor. А уже полученные изображения можно и через ocr пускать создав pdf или djvu.

einhander ★★★★★
(15.06.23 23:17:41 MSK)

Ссылка

Ответ на: комментарий от hobbit 15.06.23 21:28:09 MSK

Ещё б найти, что в линуксе может сканировать документ на много страниц в один PDF

XSane же, самая основная сканировалка, она и может.

James_Holden ★★★★★
(15.06.23 23:43:25 MSK)

Ссылка

Ответ на: комментарий от token_polyak 15.06.23 21:03:44 MSK

В общем, попробовал я gImageReader-Qt6. С групповым сохранением в PDF у него проблемы, по одному сохраняет. При распознавании им же через tesseract результат распознавания есть, с большим количеством огрехов.

Далее я для очистки совести попробовал скормить в командной строке tesseract-у с явно указанным языком rus растровую картинку, сохранённую в gImageReader. И вот тут началось самое интересное! Первая и последняя треть листа распознались идеально, без единой ошибки. Зато середины текста нет, как корова языком слизала. При том, что в png-файле изображение текста присутствует полностью и одинакового качества на всех участках.

Со всем этим, конечно, надо будет разбираться. Но вчера я в качестве временной меры отсканировал весь многостраничный материал в PDF. C этим прекрасно справился gscan2pdf, если нужно просто создать многстраничный скан, то эта программа с задачей справляется на твёрдую пятёрку. Потом скормил этот PDF (к счастью, не конфиденциальный) онлайн-сервису https://convertio.co/. Я их попробовал три штуки, этот сервис — единственный, кто честно распознаёт текст (на пятёрку с минусом, я бы сказал) и возвращает его в виде .docx, остальные распробованные просто вставляют в документ картинки. У сервиса ограничение, бесплатно можно отсканировать до 10 листов.

Вот такой вот workaround, подойдёт не для всех задач. На будущее, конечно, надо проблему решать, например, исследовать «интересное» поведение tesseract… Тему решённой пока не помечаю.

hobbit ★★★★★
(16.06.23 11:20:28 MSK) автор топика
Последнее исправление: hobbit 16.06.23 11:23:29 MSK (всего исправлений: 3)

Ответ на: комментарий от hobbit 16.06.23 11:20:28 MSK

В общем да, единственная свободная сюита, в которой я видел большинство необходимого - это монструозный OCR-D, ориентированный на пропуск через пайплайны целых книг. Вот там тебе и предобработка изображения, и нарезка на колонки-абзацы-строки, и распознавание несколькими OCR (а то из тессеракта >=4 вырезали, например, распознавание жирный ли текст или курсивом написан), и вывод в разные форматы - всё в одном.

А сохранять в один PDF gImageReader всё-таки умеет.

token_polyak ★★★★★
(16.06.23 11:25:49 MSK)
Последнее исправление: token_polyak 16.06.23 11:43:46 MSK (всего исправлений: 3)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← не скачивается линукс (openSUSE)

Desktop

Пауза перед запуском некоторого софта →

Похожие темы