LINUX.ORG.RU

Удалить слой текста из pdf

 


0

1

Привет!

Купил Киндл, решил почитать немного научной литературы. Понятно, что с формулами и прочими ништяками mobi мне не подойдет. Заявлена поддержка PFD вроде как. Но открыть здоровую книжку оно не вытягивает (мегабайт 60). Там скан+текстовая подложка.

В итоге я решил вопрос просто: пережать PDFку из цветной в Grayscale (читалка то все равно цвет не умеет).

Нагуглил команду:

gs -sOutputFile=output.pdf -sDEVICE=bmpgray -sColorConversionStrategy=Gray -dProcessColorModel=/DeviceGray -dCompatibilityLevel=1.4 input.pdf < /dev/null
Для одной книжки все ок. А вторая получилась 1.3 гигабайта. Судя по всему оно попыталось все шрифты перепаковать (вроде как еще и для каждой страницы отдельно).

Ну и возник логичный вопрос: а можно как-то через gs убрать весь текст и вектор? Толку то все равно ноль.

И небольшой совет от себя: Sony PRS-T3 жирнее за Kindle Paperwhite 2. Пользовался обеими.

Перегони лучше в дежавю. Там сжатие поприличней будет.

Я вот такой скриптик для сканов использую:

/bin/sh
echo "Beginning"
for file in `ls -1`
do
    c44 $file
    echo "File $file processed"
done
echo -e "Linking all... \c"
djvm -c book.djview *.djvu
echo "Done!"
rm *.djvu
mv book.djview book.djvu

Если картинки монохромные, лучше будет cjb2 в качестве компрессора взять.

Eddy_Em ☆☆☆☆☆ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.