LINUX.ORG.RU

pdf2djvu


0

0

Задача перевести файл PDF в DJVU

в пакете djvulibre существует утилита djvudigital, переводящая PS/PDF в djvu, но она ругается на текущий gs. Дистрибутив Fedora 7

Вопрос: подскажите как перевести pdf в djvu.

anonymous

забыл добавить, всё это требуется сделать оффлайн, т.е. без подключения к инету

anonymous
()
Ответ на: комментарий от dGhost

>>в пакете djvulibre существует утилита djvudigital, переводящая PS/PDF в djvu, но она ругается на текущий gs

цитирую самого себя, если сабж не читаете (

anonymous
()
Ответ на: комментарий от anonymous

В догонку, any2djvu,равно как и http://any2djvu.djvuzone.org/any2djvu.php

выдаёт Now running DjVu Conversion...

Internal error at ./src/gdevdjvu.c:2832

/home/snwiz/bin/djvudigital: line 325: 31252 Aborted $run $gsdjvu "-r$dpi" $gsverbosity $gsprinted $gsepsf "-sOutputFile=$backend" $gsarg0 $gsarg1 $gsarg2 -f "$infile" -c quit

anonymous
()

#!/bin/sh
a=$1
b=ppm
c=djvu
if [ -z "$1" ] ;then
echo "Usage: pdf2djvu.sh pdf_file" && exit
fi
d=`pdftk $1 dump_data|grep NumberOfPages|awk 'BEGIN {FS=": "} {print $2}'`
for k in `seq -w 1 $d`;do
pdftk $1 cat $k output $k.pdf && convert $k.pdf $k.$b && rm $k.pdf && c44 -bpp 0.25,0.5,1 $k.$b $k.$c && rm $k.$b
done
djvm -c `basename $1 .pdf`.djv *.$c && rm *.djvu

botrops-schlegelii ★★
()
Ответ на: комментарий от botrops-schlegelii

нужны ещё
pdftk
imagemagick(или graphicsmagick - тогда надо исправить "convert" на "gm convert")
качество - "c44 -bpp 0.25,0.5,1"
зы
это без текстового слоя - конвертирует как изображение с буквами,
если кто ещё и импорт текста из pdf в djview подскажет как сделать - буду благодарен ...

botrops-schlegelii ★★
()
Ответ на: комментарий от botrops-schlegelii

спасибо огромное!

чуть подточил напильником и сработало

теперь буду разбираться с ocr

anonymous
()
Ответ на: комментарий от botrops-schlegelii

кому интерестно рассказываю )) во-первых , утилита djvudigital работает в Fedora 6-8 (tested), если кой-чего дособрать ручками,

а именно gsdjvu, который можно скачать на сайте http://djvu.sourceforge.net/

как её собрать там адекватно написано

во-вторых, тот скрипт, приведенный выше работает, но он медленнее на порядок, чем djvudigital, да и сегфолт на страницах иногда дает просто так

попутно, он не сохраняет текста в djvu

anonymous
()
Ответ на: комментарий от anonymous

>медленнее
1)зато универсальнее(код) - я таким же образом перегонял сканы из jpeg в djview
2)и не знал, что gsdjvu надо качать отдельно
http://djvu.sourceforge.net/gsdjvu.html

>сегфолт
это чья проблема ?
скрипт передаёт неправильные данные ?
pdftk ?
imagemagick ?
djview ?

botrops-schlegelii ★★
()
Ответ на: комментарий от anonymous

и вообще ...
мне нравиться работать с pdf посредством pdftk+xpdf-tools, а не ghostscript (если дело касается потрошения pdf и/или конвертации в другие форматы)

botrops-schlegelii ★★
()
Ответ на: комментарий от botrops-schlegelii

подточил - это я про настройки качества при перегонке

сегфолт даёт pdf-ный конвертер.

кстати, по поводу самой задачи, это перегонка собственной библиотеки из pdf (книги, справочники) в djv.

практика показывает, что на 100 метров pdf получается 80 метров djv. На AMD Thurion x2, 1900 MHz скорость преобразования около 2 Мб в минуту на ядро.

еще вопросы? ))

anonymous
()
Ответ на: комментарий от anonymous

про gsdjvu - его надо качать, если сам gs не поддерживает djvu,

правда эта штука распространяется под лицензией СPL, которая несовместима с GPL.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.