LINUX.ORG.RU

Вышел ScanTailor 0.9.8

 , ,


0

0

Тихо и незаметно вышла новая версия программы ScanTailor. ScanTailor — это кросс-платформенное приложение, написанное на qt4, предназначенное для пакетной обработки сканированных книг с целью последующего сохранения в djvu или pdf. Основные изменения в версии 0.9.8:

  • Удаление пятен: улучшен алгоритм, регулировка агрессивности, визуализация.

  • Увеличен диапазон подстройки порога бинаризации.

  • Исправлено несколько падений.

  • Перевод на японский.

  • Отключено OpenGL-ускорение интерфейса из-за его нестабильности.

C момента последней новости на ЛОРе программа была значительно улучшена и доработана (см. полный чейнджлог. Благодаря простоте работы с программой и высокому качеству результата все больше и больше людей выбирают ScanTailor в качестве основного инструмента при оцифровке книг.

>>> Оф. сайт

★★★★★

Проверено: mono ()

Надо потестить будет

Zhbert ★★★★★ ()

Оно нужно?

anonymous ()

Сайт гламурный до безобразия.

Перевод на Японский.

Ну прям самое важное для здешней аудитории.

anonymous ()

какие отличия от xsane?

anonymous ()

Помню были времена, возмешь тетрадь с лекциями у сокурсницы, отксерокопируешь и учишь.

Потом знакомые брали цифровой фотик и получали все в электронном виде.

Теперь еще эти фотки можно пакетно обработать и получить все в одном файле.

Эх вернуться бы сейчас в эти студенческие годы...

AlexVR ★★★★★ ()

Отличная софтина. Недавно попользовался, отличный функционал. Разрабам респект и уважуха)

//symptam the

anonymous ()

Отличная программа!

Пользуюсь регулярно.

angrycore ()

Сотни нефти и интернетов. Немало книг обработал этой программой. Очень полезная весч.

balodja ★★★ ()

> Благодаря простоте работы с программой и высокому качеству результата все больше и больше людей выбирают ScanTailor

А без аквафреша в новости нельзя было обойтись? Для спам-рассылки что ли писали?

Biga ()
Ответ на: комментарий от anonymous

Xsane - это программа для сканирования, st для обработки.

petrosyan ★★★★★ ()

А распознание на лету к этому чуде не прикрутить?

Ramzes001 ★★ ()

Хм... Давно искал такую программу, уже отчаялся.

Nixopatolog ()
Ответ на: комментарий от Nixopatolog

> Давно искал такую программу

А, нет, отбой, видел эту, не впечатлило. Хотя новую версию посмотрю.

Nixopatolog ()

А как оно по сравнению с gscan2pdf?

Zombieff ★★ ()

а как оно по сравнению с unpaper?

psv1967 ★★★★★ ()
Ответ на: комментарий от Zombieff

ST организован проще и логичнее, больше возможностей для обработки (например, в gscan я не нашел опции бинаризации), выдает лучший результат, работает быстрее, не завязан только на pdf. Из недостатков - не умеет сканировать, распознавать и сохранять pdf\djvu. В прочем, учитывая unixway это не такие уж и недостатки.

petrosyan ★★★★★ ()
Ответ на: комментарий от petrosyan

т.е. сканировать надо xsane (допустим), а потом уже гору файлов обрабатывать сабжем? занятно, надо будет глянуть.

anonymous ()
Ответ на: комментарий от anonymous

Причем, одна из самых радостных для меня фишек — это в том, что можно сканировать, как попало. Главное — чтобы весь текст влез в скан. А ST сам уже повернет и разрежет. Это дико удобно.

balodja ★★★ ()
Ответ на: комментарий от petrosyan

Что за бинаризация? Перевод в чисто чёрный/белый? В gscan2pdf оно есть. Делается при очистке, пороги чёрного/белого настраиваются.

gscan2pdf умеет сохранять и в djvu, и в pdf, и в мультистраничный tiff. Умеет сканировать. Умеет чистить страницы с помощью unpaper (средненько). Также есть поддержка трёх систем распознавания текста — gocr, tesseract и ocropus (кто-то из них даже русский распознаёт, но плохо).

По этим параметрам что у сабжа? Как и чем чистит страницы, чем и как распознаёт текст?

Zombieff ★★ ()
Ответ на: комментарий от balodja

> ST сам уже повернет и разрежет

А вот это интересно, надо попробовать.

Zombieff ★★ ()
Ответ на: комментарий от anonymous

Да. И в этом имхо есть резон т.к. у xsane и тем более у vuescan настройки сканирования куда более продвинутые.

petrosyan ★★★★★ ()
Ответ на: комментарий от Zombieff

>В gscan2pdf оно есть.

может быть. Я особо не разбирался. Посмотрел на тормоза и забил на этот gscan

gscan2pdf умеет сохранять и в djvu

djvulibre? Тогда не нужно. Оно сопоставимо с закрытым виндовым кодером разве что если весь скан битональный и то надо очень тщательно опции подбирать.

Умеет чистить страницы с помощью unpaper (средненько).

ST чистит отлично. Там даже какие-то алгоритмы из skankromsator'a заимствованы.

Также есть поддержка трёх систем распознавания текста


Сомнительная фича, особенно для книг, язык которых отличен от английского. FineReader + djvuocr под вайном всяко эффективней.

petrosyan ★★★★★ ()

Прекрасная программа.

anonymous ()
Ответ на: комментарий от petrosyan

djvulibre? Тогда не нужно. Оно сопоставимо с закрытым виндовым кодером разве что если весь скан битональный и то надо очень тщательно опции подбирать.

А чем djvulibre не угодила?

ogronom ()
Ответ на: комментарий от petrosyan

Спасибо за ответ, но

FineReader + djvuocr под вайном всяко эффективней

Чем тот же Cuneiform не нравится? Да, под линукс пока нормального интерфейса нет, но под тем же вайном вроде бы можно запустить отличный виндовый. И распознаёт хорошо. Зато не надо покупать/воровать FineReader.

Zombieff ★★ ()
Ответ на: комментарий от Zombieff

>Чем тот же Cuneiform не нравится?

Тем что его еще пилить и пилить. С очень нужным мне румынским он толком не работает, для русского тоже много мусора выдает по сравнению с файном. Про распознавание текстов на нескольких языках сразу я вообще молчу. Есть какая-то сборка (типа форка) которая знает пары типа русский-английский, русский-французский, но задать произвольный набор из 2 и более языков не получится. Кроме того я не знаю готового решения как с помощью cf добавить ocr в djvu.

Зато не надо покупать/воровать FineReader.


djvuocr прекрасно работает с триальной версией файна (которая не дает сохранять результаты распознавания). Так что если использовать только для этих целей, то необходимости в покупке или поиске пиратки нет.

petrosyan ★★★★★ ()

>Отключено OpenGL-ускорение интерфейса из-за его нестабильности.

«я ждал этого всюю нооочь...» (C)

anonymous ()
Ответ на: комментарий от anonymous

кстати у проекта есть ветка обсуждения на руборде уже более чем на 9000 страниц, для Ъ ссылок не даю, а не Ъ могут легко ввести два слова в гуголе

anonymous ()
Ответ на: комментарий от Zombieff

Вот за что люблю лор, так это за ссылки на интересные программы. Только несколько дней назад искал программу именно с таким функционалом. Еще бы версию под венду чтоб с демона sane сканировала нарыть...

AVL2 ★★★★★ ()

Вообще не понял, как в этом тейлоре сохранить результат.

При создании проекта указал выходную директорию, но там пусто.

AVL2 ★★★★★ ()
Ответ на: комментарий от AVL2

А, похоже в вендоой версии тейлора потеряна поддержка вывода в pdf

AVL2 ★★★★★ ()
Ответ на: комментарий от AVL2

там нет иного вывода нежели постранично в тифф.

есть еще неофициальные патчи, для извращенного вывода(в несколько папок, но опять же в тифф) связанного с отдельным кодированием изображений и текста в дежавю.

Но в официальной вывод происходит в папку out постранично в тифах после прохождения всех этапов с первого до последнего.

Впрочем пройти как-то иначе этапы нельзя, поэтому можно сказать что после последнего.

anonymous ()
Ответ на: комментарий от anonymous

понятно. Вообще программа оставила двойственные ощущения. Вроде инструменты неплохо сделаны, но во первых с тормозами и все время ожидаешь подвоха. Не сразу понятно, к каким страницам применяется обработка и все такое.

И самое главное, почему нет встроенной функции сканирования (желательно как в gscan2pdf с поддержкой пакетного сканирования, с эмуляцией переворота и автоподатчика) и нет печати? Да и вызов ocr не помешал бы. С возможностью сохранения в пдф и дежавю на текстовые слои для поиска и закладок.

Короче программа выглядит сильно недоделанной в функционале.

AVL2 ★★★★★ ()

subj

Классная программа. Постоянно использую.

shiz ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.