LINUX.ORG.RU

О том, как объединить несколько pdf в один в Linux


1

1

Преамбула: наш универ стал вместо бумажных книг покупать подписки на электронные. Как они устроены: на сайте лежит книга, разбитая на главы, каждая из которых представлена отдельным файлом. В каждом файле нумерация страниц логическая, т.е. начинается с номера *реальной* странице в воображаемой целой книге. Кроме этого, каждый pdf содержит index (оглавление), по которому можно быстро перемещаться по отдельным секциям внутри файла

Что хочется: объединить все в один pdf, сохранив (создав) полное оглавление.

Проблема:

1. Если объединять с помощью pdftk

pdftk 1-10.pdf 11-20.pdf cat output all.pdf

то полученный all.pdf не содержит оглавления (Index) вообще

2. если объединять с помощью ghostscript

gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=all.pdf 1-10.pdf 11-20.pdf

то полученный файл содержит оглавление, однако, вторая глава из файла 11-20.pdf почему-то ссылается (в оглавлении) на страницы с номерами от 1 до 10, т.е. как бы при генерации индекса каждая в начале каждой главы сбрасывается счетчик страниц и все начинается опять с 1.

Проблема описана также тут: http://stackoverflow.com/a/3108884 но без решения.

ЛОР, помоги! Как сделать нормальное оглавление?

Читат в вики, что при объединении *ps* файлов надо резетить интерпретатор, чтобы все было корректно. Тут видимо, надо как-то сказать интерпретатору, чтобы не трогал логические номера страниц, но как?!

★★★★★

ТС, похоже, не в курсе, что pdf как бы уже сверстанный материал. И глобальной правки он не подразумевает. Если надо объединить с сохранением сквозной нумерации, оглавлениями, предметным указателем, списком литературы, преферансом и гимназистками, нужно перекомпилировать исходники этих pdf.

Eddy_Em ☆☆☆☆☆
()

А второй вариант - взять студента-двоечника и посадить его в каком-нибудь scribus'е или (если студент — вообще паразит и заслуживает ботинок) LO посимвольно править все тексты.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

А ты предлагаешь выдергивать текст с картинками из пдф, затем все заново собирать ? :-) Я с ней просто довольно много работал и в ней все делается очень быстро. Это так кажется что это долго, на самом деле это минутное занятие.

SergMarkov
()
Ответ на: комментарий от SergMarkov

Я предлагаю найти исходники и перекомпилять. Иначе придется долго и кропотливо делать правки вручную.

Хотя, конечно, можно попробовать скриптик наваять, который вам хотя бы номера страниц подправит. Но с библиографией все равно будет беда.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

Это занимает считанные минуты без всяких исходников.
Нет, блин, но почему все надо делать по православнутому в 100 раз больше по времени, когда есть способ сделать в 100 раз проще и быстрее ?

SergMarkov
()
Ответ на: комментарий от SergMarkov

есть способ сделать в 100 раз проще и быстрее ?

Хотелось бы узнать, что же за способ такой - перенумеровать все страницы и заголовки в автомате?

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

Ну сматри :-) Ты ищещь исходники, в ответ «АВОТХ..» пьешь кофе, вискарь, пиво (нужное подчеркнуть), горестно думаешь «НУПОШЛИВЫВСЕНАХ», потом берешь эту прогу и делаешь. Затраты времени и нервов явно больше чем в случае когда ты прогу взялся сразу :-)

SergMarkov
()
Ответ на: комментарий от SergMarkov

Всё-таки не зря ты у меня в игноре, ты туповат.

Требуется все сделать на автомате, потому что глав в книге десятки и книг будет, возможно, много. Ручная правка тут никому не нужна.

Впрочем, я нашел некоторое решение. Вопрос теперь в том, можно ли это сделать с помощью стандартного gs.

unanimous ★★★★★
() автор топика
Ответ на: комментарий от unanimous

Себя умнее почувствовал после таких реплик ? :-) Молодец, попей молочко с полки :-) Еще раз, ты много дольше будешь курить маны, искать в гуле, пищать на лоре, чем сразу взять прогу в руки и сделать. Но у православнутых линупсятников мозги заточены под. .. :-)

SergMarkov
()

Топик какбэ намекает об уровне нашей системы образования и умственных способностях тех, кто разбивает книги на файлы.

r2d2
()
Ответ на: комментарий от SergMarkov

Я уже всё нашел, успокойся, но еще жду умных людей, которым есть что сказать. Ты высказался, прошу более не разводить бессмысленный флуд.

unanimous ★★★★★
() автор топика
Ответ на: комментарий от r2d2

Топик какбэ о книгах от издательства Springer, хотя я согласен, что библиотека делает херню. И да, универ западный.

unanimous ★★★★★
() автор топика
Ответ на: комментарий от Eddy_Em

нужно перекомпилировать исходники этих pdf.

Повтори, пожалуйста, это идиотам из издательства Springer, хорошо?

unanimous ★★★★★
() автор топика
Ответ на: комментарий от r2d2

Да кто бы спорил. Мне вообще нафиг не сдался их убогий, тормозящий сайт, мне нужна книжка. Или, на худой конец, нормальный pdf для чтения на луюом подходящем девайсе.

unanimous ★★★★★
() автор топика

В принципе, я нашел более-менее ОК решение с использованием pdfsam, по крайней мере оно работает. Но у меня есть ощущение, что gs должен справиться тоже, просто я не знаю каких-то хитростей.

unanimous ★★★★★
() автор топика
Ответ на: комментарий от unanimous

А вообще, говна повонючее этого спрингера еще поискать надо…

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от unanimous

Нет, конечно. Springer - дрянное издательство, ничего там нет.

Eddy_Em ☆☆☆☆☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.