LINUX.ORG.RU
 
petrosyan

Вышел ScanTailor 0.9.8


0

0

Тихо и незаметно вышла новая версия программы ScanTailor. ScanTailor — это кросс-платформенное приложение, написанное на qt4, предназначенное для пакетной обработки сканированных книг с целью последующего сохранения в djvu или pdf. Основные изменения в версии 0.9.8:

  • Удаление пятен: улучшен алгоритм, регулировка агрессивности, визуализация.

  • Увеличен диапазон подстройки порога бинаризации.

  • Исправлено несколько падений.

  • Перевод на японский.

  • Отключено OpenGL-ускорение интерфейса из-за его нестабильности.

C момента последней новости на ЛОРе программа была значительно улучшена и доработана (см. полный чейнджлог. Благодаря простоте работы с программой и высокому качеству результата все больше и больше людей выбирают ScanTailor в качестве основного инструмента при оцифровке книг.

>>> Оф. сайт


[#]  
Zhbert

Надо потестить будет

*** ()
[#]  

Оно нужно?

anonymous ()
[#] Ответ на: комментарий от anonymous 09.04.2010 11:41:19  
ArtemZ

для тех, кто сканирует книги думаю нужно

* ()
[#]  

Сайт гламурный до безобразия.

> Перевод на Японский.

Ну прям самое важное для здешней аудитории.

anonymous ()
[#]  

какие отличия от xsane?

anonymous ()
[#] Ответ на: комментарий от anonymous 09.04.2010 11:56:46  
Andaril

а я понцы не аудитория?

* ()
[#]  
AlexVR

Помню были времена, возмешь тетрадь с лекциями у сокурсницы, отксерокопируешь и учишь.

Потом знакомые брали цифровой фотик и получали все в электронном виде.

Теперь еще эти фотки можно пакетно обработать и получить все в одном файле.

Эх вернуться бы сейчас в эти студенческие годы...

** ()
[#]  

Отличная софтина. Недавно попользовался, отличный функционал. Разрабам респект и уважуха)

//symptam the

anonymous ()
[#]  
angrycore

Отличная программа!

Пользуюсь регулярно.

* ()
[#]  
balodja

Сотни нефти и интернетов. Немало книг обработал этой программой. Очень полезная весч.

*** ()
[#]  

> Благодаря простоте работы с программой и высокому качеству результата все больше и больше людей выбирают ScanTailor

А без аквафреша в новости нельзя было обойтись? Для спам-рассылки что ли писали?

* ()
[#] Ответ на: комментарий от Biga 09.04.2010 12:47:31  
balodja

Ник писавшего новость кагбэ намекает, что нет.

*** ()
[#] Ответ на: комментарий от anonymous 09.04.2010 12:08:47  
petrosyan

Xsane - это программа для сканирования, st для обработки.

*** ()
[#]  
Ramzes001

А распознание на лету к этому чуде не прикрутить?

* ()
[#]  
Nixopatolog

Хм... Давно искал такую программу, уже отчаялся.

* ()
[#] Ответ на: комментарий от Nixopatolog 09.04.2010 15:06:07  
Nixopatolog

> Давно искал такую программу

А, нет, отбой, видел эту, не впечатлило. Хотя новую версию посмотрю.

* ()
[#]  
Zombieff

А как оно по сравнению с gscan2pdf?

* ()
[#]  
psv1967

а как оно по сравнению с unpaper?

*** ()
[#] Ответ на: комментарий от Zombieff 09.04.2010 15:23:14  
petrosyan

ST организован проще и логичнее, больше возможностей для обработки (например, в gscan я не нашел опции бинаризации), выдает лучший результат, работает быстрее, не завязан только на pdf. Из недостатков - не умеет сканировать, распознавать и сохранять pdf\djvu. В прочем, учитывая unixway это не такие уж и недостатки.

*** ()
[#] Ответ на: комментарий от petrosyan 09.04.2010 13:21:02  

т.е. сканировать надо xsane (допустим), а потом уже гору файлов обрабатывать сабжем? занятно, надо будет глянуть.

anonymous ()
[#] Ответ на: комментарий от anonymous 09.04.2010 16:03:35  
balodja

Причем, одна из самых радостных для меня фишек — это в том, что можно сканировать, как попало. Главное — чтобы весь текст влез в скан. А ST сам уже повернет и разрежет. Это дико удобно.

*** ()
[#] Ответ на: комментарий от petrosyan 09.04.2010 15:58:29  
Zombieff

Что за бинаризация? Перевод в чисто чёрный/белый? В gscan2pdf оно есть. Делается при очистке, пороги чёрного/белого настраиваются.

gscan2pdf умеет сохранять и в djvu, и в pdf, и в мультистраничный tiff. Умеет сканировать. Умеет чистить страницы с помощью unpaper (средненько). Также есть поддержка трёх систем распознавания текста — gocr, tesseract и ocropus (кто-то из них даже русский распознаёт, но плохо).

По этим параметрам что у сабжа? Как и чем чистит страницы, чем и как распознаёт текст?

* ()
[#] Ответ на: комментарий от balodja 09.04.2010 16:15:51  
Zombieff

> ST сам уже повернет и разрежет

А вот это интересно, надо попробовать.

* ()
[#] Ответ на: комментарий от anonymous 09.04.2010 16:03:35  
petrosyan

Да. И в этом имхо есть резон т.к. у xsane и тем более у vuescan настройки сканирования куда более продвинутые.

*** ()
[#] Ответ на: комментарий от Zombieff 09.04.2010 16:40:35  
petrosyan

>В gscan2pdf оно есть.

может быть. Я особо не разбирался. Посмотрел на тормоза и забил на этот gscan

>gscan2pdf умеет сохранять и в djvu

djvulibre? Тогда не нужно. Оно сопоставимо с закрытым виндовым кодером разве что если весь скан битональный и то надо очень тщательно опции подбирать.

>Умеет чистить страницы с помощью unpaper (средненько).

ST чистит отлично. Там даже какие-то алгоритмы из skankromsator'a заимствованы.

>Также есть поддержка трёх систем распознавания текста


Сомнительная фича, особенно для книг, язык которых отличен от английского. FineReader + djvuocr под вайном всяко эффективней.

*** ()
[#]  

Прекрасная программа.

anonymous ()
[#] Ответ на: комментарий от petrosyan 09.04.2010 17:15:55  

> djvulibre? Тогда не нужно. Оно сопоставимо с закрытым виндовым кодером разве что если весь скан битональный и то надо очень тщательно опции подбирать.

А чем djvulibre не угодила?

* ()
[#]  
Nebuchadnezzar

>Перевод на японский.

結構です!

** ()
[#] Ответ на: комментарий от petrosyan 09.04.2010 17:15:55  
Zombieff

Спасибо за ответ, но

> FineReader + djvuocr под вайном всяко эффективней

Чем тот же Cuneiform не нравится? Да, под линукс пока нормального интерфейса нет, но под тем же вайном вроде бы можно запустить отличный виндовый. И распознаёт хорошо. Зато не надо покупать/воровать FineReader.

* ()
[#] Ответ на: комментарий от Zombieff 09.04.2010 20:20:24  
petrosyan

>Чем тот же Cuneiform не нравится?

Тем что его еще пилить и пилить. С очень нужным мне румынским он толком не работает, для русского тоже много мусора выдает по сравнению с файном. Про распознавание текстов на нескольких языках сразу я вообще молчу. Есть какая-то сборка (типа форка) которая знает пары типа русский-английский, русский-французский, но задать произвольный набор из 2 и более языков не получится. Кроме того я не знаю готового решения как с помощью cf добавить ocr в djvu.

>Зато не надо покупать/воровать FineReader.


djvuocr прекрасно работает с триальной версией файна (которая не дает сохранять результаты распознавания). Так что если использовать только для этих целей, то необходимости в покупке или поиске пиратки нет.

*** ()
[#]  

>Отключено OpenGL-ускорение интерфейса из-за его нестабильности.

"я ждал этого всюю нооочь..." (C)

anonymous ()
[#] Ответ на: комментарий от anonymous 10.04.2010 3:59:15  

кстати у проекта есть ветка обсуждения на руборде уже более чем на 9000 страниц, для Ъ ссылок не даю, а не Ъ могут легко ввести два слова в гуголе

anonymous ()
[#] Ответ на: комментарий от Zombieff 09.04.2010 15:23:14  

Вот за что люблю лор, так это за ссылки на интересные программы. Только несколько дней назад искал программу именно с таким функционалом. Еще бы версию под венду чтоб с демона sane сканировала нарыть...

***** ()
[#]  

Вообще не понял, как в этом тейлоре сохранить результат.

При создании проекта указал выходную директорию, но там пусто.

***** ()
[#] Ответ на: комментарий от AVL2 10.04.2010 14:53:34  

А, похоже в вендоой версии тейлора потеряна поддержка вывода в pdf

***** ()
[#] Ответ на: комментарий от AVL2 10.04.2010 15:01:58  

там нет иного вывода нежели постранично в тифф.

есть еще неофициальные патчи, для извращенного вывода(в несколько папок, но опять же в тифф) связанного с отдельным кодированием изображений и текста в дежавю.

Но в официальной вывод происходит в папку out постранично в тифах после прохождения всех этапов с первого до последнего.

Впрочем пройти как-то иначе этапы нельзя, поэтому можно сказать что после последнего.

anonymous ()
[#] Ответ на: комментарий от anonymous 10.04.2010 17:22:36  

понятно. Вообще программа оставила двойственные ощущения. Вроде инструменты неплохо сделаны, но во первых с тормозами и все время ожидаешь подвоха. Не сразу понятно, к каким страницам применяется обработка и все такое.

И самое главное, почему нет встроенной функции сканирования (желательно как в gscan2pdf с поддержкой пакетного сканирования, с эмуляцией переворота и автоподатчика) и нет печати? Да и вызов ocr не помешал бы. С возможностью сохранения в пдф и дежавю на текстовые слои для поиска и закладок.

Короче программа выглядит сильно недоделанной в функционале.

***** ()
[#]  

subj

Классная программа. Постоянно использую.

()