LINUX.ORG.RU

редактор DjVu

 


0

2

Всем здрасьте! Подскажите редактор DjVu под линь. В общем-то нужна одна единственная функция - разрезания файла на части. Всмысле страницы на части. Иногда встречаются книги, которые просканированы в разворот и страницы сдвоены. А надо файл в которой будут по одной страницы. Если такой нету, есть ли библиотеки, с помощью которой можно такое самому сделать?

Ответ на: комментарий от AITap

попробую, но пока хотел разобраться с imagemagick. Теперь вопрос по ImageMagick. Работать из него с djvu не получается - Рам заполняется под 100% и комп виснет... Я сначала файл конвертил из djvu в pdf (ddjvu) и работал с ним. Тут возникла другая проблема. При вводе команды convert 1.pdf -crop 386x602+0 +repage 2.pdf все делается как надо, только качество страниц становится хреновым. Почему? Надо будет попробовать конвертнуть не pdf и посмотреть...

full_screen
() автор топика
Ответ на: комментарий от full_screen

после crop каждое изображение в pdf имеет размер 46x72 - показывает identify. Исходное было 773x602!

full_screen
() автор топика
Ответ на: комментарий от full_screen

ImageMagick иногда перед выполнением трансформаций загружает в память все предложенные ему изображения, даже если может обойтись без этого. Пользоваться специальными DjVu декодерами (ddjvu) - правильнее.

При вводе команды convert 1.pdf -crop 386x602+0 +repage 2.pdf все делается как надо, только качество страниц становится хреновым.

Попробуйте подкрутить разрешение PDF при помощи параметра -density (150 или 300, по умолчанию ~75?). Учтите, что изображения в PDF могут храниться очень разными способами (от JPEG, который плохо подходит для текста, до 1-битного JBIG2, сравнимого с DjVu-шным CJB2 по степени сжатия), и ImageMagick использует только один из них (какой, кстати?). Не факт, что он при этом пересохранении в формат PDF не допускает потерь/неоптимальностей.

Надо будет попробовать конвертнуть не pdf и посмотреть...

Временные файлы храните в TIFF или PNM, так и кодировать/декодировать не проблема, и потерь на сжатие не будет. Места на них, правда, нужно очень много.

AITap ★★★★★
()
Ответ на: комментарий от AITap

Спасибо, проблему решил в другой теме, которую создал в Генерал. Надо ставить ограничение на использование память с помощью -limit memory SIZE, -limit map SIZE (в МегаБайтах). Тогда работает. Правда у меня из файла размером в 20 МБ с -density 300 вышло 120МБ... ну и очень медленно, естественно. Я решил отказаться в работе с пдф от Магии. Использую скрипт с PyPDF, ссылка на которую есть в нижеследующей теме. Работает в 2 секунды и как нужно.
Вот: https://www.linux.org.ru/forum/general/11857114

full_screen
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.