LINUX.ORG.RU

Вышел ScanTailor 0.9.8

 , ,


0

0

Тихо и незаметно вышла новая версия программы ScanTailor. ScanTailor — это кросс-платформенное приложение, написанное на qt4, предназначенное для пакетной обработки сканированных книг с целью последующего сохранения в djvu или pdf. Основные изменения в версии 0.9.8:

  • Удаление пятен: улучшен алгоритм, регулировка агрессивности, визуализация.

  • Увеличен диапазон подстройки порога бинаризации.

  • Исправлено несколько падений.

  • Перевод на японский.

  • Отключено OpenGL-ускорение интерфейса из-за его нестабильности.

C момента последней новости на ЛОРе программа была значительно улучшена и доработана (см. полный чейнджлог. Благодаря простоте работы с программой и высокому качеству результата все больше и больше людей выбирают ScanTailor в качестве основного инструмента при оцифровке книг.

>>> Оф. сайт

★★★★★

Проверено: mono ()

Надо потестить будет

Zhbert ★★★★★ ()

Сайт гламурный до безобразия.

Перевод на Японский.

Ну прям самое важное для здешней аудитории.

anonymous ()

Помню были времена, возмешь тетрадь с лекциями у сокурсницы, отксерокопируешь и учишь.

Потом знакомые брали цифровой фотик и получали все в электронном виде.

Теперь еще эти фотки можно пакетно обработать и получить все в одном файле.

Эх вернуться бы сейчас в эти студенческие годы...

AlexVR ★★★★★ ()

Отличная софтина. Недавно попользовался, отличный функционал. Разрабам респект и уважуха)

//symptam the

anonymous ()

Отличная программа!

Пользуюсь регулярно.

angrycore ()

Сотни нефти и интернетов. Немало книг обработал этой программой. Очень полезная весч.

balodja ★★★ ()

> Благодаря простоте работы с программой и высокому качеству результата все больше и больше людей выбирают ScanTailor

А без аквафреша в новости нельзя было обойтись? Для спам-рассылки что ли писали?

Biga ()

А распознание на лету к этому чуде не прикрутить?

Ramzes001 ★★ ()
Ответ на: комментарий от Nixopatolog

> Давно искал такую программу

А, нет, отбой, видел эту, не впечатлило. Хотя новую версию посмотрю.

Nixopatolog ()

а как оно по сравнению с unpaper?

psv1967 ★★★★★ ()
Ответ на: комментарий от Zombieff

ST организован проще и логичнее, больше возможностей для обработки (например, в gscan я не нашел опции бинаризации), выдает лучший результат, работает быстрее, не завязан только на pdf. Из недостатков - не умеет сканировать, распознавать и сохранять pdf\djvu. В прочем, учитывая unixway это не такие уж и недостатки.

petrosyan ★★★★★ ()
Ответ на: комментарий от petrosyan

т.е. сканировать надо xsane (допустим), а потом уже гору файлов обрабатывать сабжем? занятно, надо будет глянуть.

anonymous ()
Ответ на: комментарий от anonymous

Причем, одна из самых радостных для меня фишек — это в том, что можно сканировать, как попало. Главное — чтобы весь текст влез в скан. А ST сам уже повернет и разрежет. Это дико удобно.

balodja ★★★ ()
Ответ на: комментарий от petrosyan

Что за бинаризация? Перевод в чисто чёрный/белый? В gscan2pdf оно есть. Делается при очистке, пороги чёрного/белого настраиваются.

gscan2pdf умеет сохранять и в djvu, и в pdf, и в мультистраничный tiff. Умеет сканировать. Умеет чистить страницы с помощью unpaper (средненько). Также есть поддержка трёх систем распознавания текста — gocr, tesseract и ocropus (кто-то из них даже русский распознаёт, но плохо).

По этим параметрам что у сабжа? Как и чем чистит страницы, чем и как распознаёт текст?

Zombieff ★★ ()
Ответ на: комментарий от balodja

> ST сам уже повернет и разрежет

А вот это интересно, надо попробовать.

Zombieff ★★ ()
Ответ на: комментарий от anonymous

Да. И в этом имхо есть резон т.к. у xsane и тем более у vuescan настройки сканирования куда более продвинутые.

petrosyan ★★★★★ ()
Ответ на: комментарий от Zombieff

>В gscan2pdf оно есть.

может быть. Я особо не разбирался. Посмотрел на тормоза и забил на этот gscan

gscan2pdf умеет сохранять и в djvu

djvulibre? Тогда не нужно. Оно сопоставимо с закрытым виндовым кодером разве что если весь скан битональный и то надо очень тщательно опции подбирать.

Умеет чистить страницы с помощью unpaper (средненько).

ST чистит отлично. Там даже какие-то алгоритмы из skankromsator'a заимствованы.

Также есть поддержка трёх систем распознавания текста


Сомнительная фича, особенно для книг, язык которых отличен от английского. FineReader + djvuocr под вайном всяко эффективней.

petrosyan ★★★★★ ()

Прекрасная программа.

anonymous ()
Ответ на: комментарий от petrosyan

djvulibre? Тогда не нужно. Оно сопоставимо с закрытым виндовым кодером разве что если весь скан битональный и то надо очень тщательно опции подбирать.

А чем djvulibre не угодила?

ogronom ()
Ответ на: комментарий от petrosyan

Спасибо за ответ, но

FineReader + djvuocr под вайном всяко эффективней

Чем тот же Cuneiform не нравится? Да, под линукс пока нормального интерфейса нет, но под тем же вайном вроде бы можно запустить отличный виндовый. И распознаёт хорошо. Зато не надо покупать/воровать FineReader.

Zombieff ★★ ()
Ответ на: комментарий от Zombieff

>Чем тот же Cuneiform не нравится?

Тем что его еще пилить и пилить. С очень нужным мне румынским он толком не работает, для русского тоже много мусора выдает по сравнению с файном. Про распознавание текстов на нескольких языках сразу я вообще молчу. Есть какая-то сборка (типа форка) которая знает пары типа русский-английский, русский-французский, но задать произвольный набор из 2 и более языков не получится. Кроме того я не знаю готового решения как с помощью cf добавить ocr в djvu.

Зато не надо покупать/воровать FineReader.


djvuocr прекрасно работает с триальной версией файна (которая не дает сохранять результаты распознавания). Так что если использовать только для этих целей, то необходимости в покупке или поиске пиратки нет.

petrosyan ★★★★★ ()

>Отключено OpenGL-ускорение интерфейса из-за его нестабильности.

«я ждал этого всюю нооочь...» (C)

anonymous ()
Ответ на: комментарий от anonymous

кстати у проекта есть ветка обсуждения на руборде уже более чем на 9000 страниц, для Ъ ссылок не даю, а не Ъ могут легко ввести два слова в гуголе

anonymous ()
Ответ на: комментарий от Zombieff

Вот за что люблю лор, так это за ссылки на интересные программы. Только несколько дней назад искал программу именно с таким функционалом. Еще бы версию под венду чтоб с демона sane сканировала нарыть...

AVL2 ★★★★★ ()

Вообще не понял, как в этом тейлоре сохранить результат.

При создании проекта указал выходную директорию, но там пусто.

AVL2 ★★★★★ ()
Ответ на: комментарий от AVL2

там нет иного вывода нежели постранично в тифф.

есть еще неофициальные патчи, для извращенного вывода(в несколько папок, но опять же в тифф) связанного с отдельным кодированием изображений и текста в дежавю.

Но в официальной вывод происходит в папку out постранично в тифах после прохождения всех этапов с первого до последнего.

Впрочем пройти как-то иначе этапы нельзя, поэтому можно сказать что после последнего.

anonymous ()
Ответ на: комментарий от anonymous

понятно. Вообще программа оставила двойственные ощущения. Вроде инструменты неплохо сделаны, но во первых с тормозами и все время ожидаешь подвоха. Не сразу понятно, к каким страницам применяется обработка и все такое.

И самое главное, почему нет встроенной функции сканирования (желательно как в gscan2pdf с поддержкой пакетного сканирования, с эмуляцией переворота и автоподатчика) и нет печати? Да и вызов ocr не помешал бы. С возможностью сохранения в пдф и дежавю на текстовые слои для поиска и закладок.

Короче программа выглядит сильно недоделанной в функционале.

AVL2 ★★★★★ ()

subj

Классная программа. Постоянно использую.

shiz ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.