LINUX.ORG.RU

сжать pdf, сделанный TeXом

 ,


2

2

Много раз сжимал сканированные pdf файлы, информации в инете море. Столкнулся с проблемой. Есть ps файл сделанный из tex файла, надо сделать pdf < 2Mb. Обычный ps2pdf дает файл 6.5 Мб. Используя всякие методы смог уменьшить до 5Мб, но далее никак. Второй день бьюсь. TeX исходники не сохранились, только этот ps. В файле ps (это диссер) имеется много графиков в eps с размером \sim 100-400 Кб. Если бы сохранились исходники, то уменьшил бы размер eps'ок и ву я ля. Пробовал pdf -> pngs -> tiffs -> pdfs -> pdf, пробовал gs с разными опциями, хуже всего работает convert, увеличивает в десятки раз. Пробовал pdf2ps, а затем обратно ps2pdf, иногда помогает. Пробовал через eps. Через acrobat pro 11, все бестолку. Остается один метод, но трудоемкий - распечатать, отсканировать и уменьшать, но не хочется. Не понимаю, почему отсканированный документ можно уменьшить, а сделанный техом нет?

Жми отдельно растровую графику. Иначе ты никак не справишься.

А если у тебя исходники были векторными, но они «внезапно» в растр превратились, то отконвертируй руками eps в pdf и собери pdflatex'ом pdf с векторной графикой!

anonymous
()
Ответ на: комментарий от anonymous

Дык, я же писал - нет исходников. Остался только этот ps. Файл был сделан 15 лет назад, и в то время не пользовали (а может еще и не было) pdflatex. Тогда все картинки делали в eps и смотрелка смотрела dvi.

rustamych ★★★
() автор топика

Мимокрокодил

Тупо открыть в каком-нибудь вьювере и распечатать в pdf?

anonymous
()
Ответ на: комментарий от anonymous

Чет я не пойму в чем фишка то. Ну открыл в файрфоксе. Сделал печать в файл, получился 180Мб (против 5 первоначальных). Есть сделать сохранить, то размер естественно не изменяется. ЧЯДНТ

rustamych ★★★
() автор топика

Много раз сжимал сканированные pdf файлы, информации в инете море.

что такое

сканированные pdf файлы

?
ты файлы сканируешь? или jpeg уже максимально пожатый сжимаешь? просвети, заинтриговало.

mos ★★☆☆☆
()
Ответ на: комментарий от mos

Еще раз, я ничего не сканирую. Имеется файл ps, сделанный из TеX файла и кучи eps графиков. Исходников больше нет. Я перегоняю его в pdf с помощью ps2pdf. Полученный pdf сжимаю немного с помощью gs, но надо сжать больше.

rustamych ★★★
() автор топика
Ответ на: комментарий от rustamych

Разложи на изображения при помощи pdfimages, посмотри, что там.

Но вряд ли тебе уже что-то поможет, если исходника нет.

anonymous
()
Ответ на: комментарий от anonymous

Не знал, хорошая штука, есть в репозитории. Да, вытащил все eps'ки. Могу конечно сейчас их уменьшить, но как потом обратно затолкать в ps вместо старых? Теховские файлы ведь не сохранились.

rustamych ★★★
() автор топика
Ответ на: комментарий от beastie

Да, мля, мля, мля, через б. Такое требование на сайте, куда надо отослать. И поругаться не с кем. Приходится уродовать хороший файл.

rustamych ★★★
() автор топика
Ответ на: комментарий от rustamych

Хм … бывает. На ум приходит поиграться с версиями pdf 1.3, 1.4 …

Ещё вот нашёл http://www.alfredklomp.com/programming/shrinkpdf/ – но не знаю, поможет ли.

ЗЫ: ещё вырезать abstract и отправить только его?

beastie ★★★★★
()
Последнее исправление: beastie (всего исправлений: 1)
Ответ на: комментарий от beastie

Этот скрипт я пробовал. Не помогает. Но кажется путь есть. epsки я выдернул, текст тоже сейчас выдерну pstotext. Придется попотеть, но стилевой файл сохранился. Но вопрос все равно остался - почему отсканированный файл можно сжать, а этот, сделанный в техе, нет. Абстракт не берут, гады.

rustamych ★★★
() автор топика
Ответ на: комментарий от rustamych

Вставлять измененные файлы - вручную!

Что ж за журнал такой, что древнючие статьи принимает? И куда исходники умудрились деть?

Придется, похоже, тебе перенабрать формулы...

А всякие онлайн-PDF-компрессоры не помогают?

anonymous
()
Ответ на: комментарий от aol

Пробовал. Convert делает хуже всех. Такая строка делает 6.7Мб из 5Мб.

rustamych ★★★
() автор топика
Ответ на: комментарий от anonymous

Это не статья, это диссер. И подавать надо не для публикации. Исходники при копировании почему-то поломались, все графики, но часть глав сохранилась, побились только первых две, где формул очень мало. В свое время не проверил, а сейчас глянул и ахнул. Но поскольку графики вытянул, то уже все намного проще. По поводу древнючих статей. Перечитываю время от времени Начала Ньютона, и вам советую. Книге уже 400 лет, но не потеряла актуальности. Использую даже иногда для чтения лекций по матану. Очень интересно прочитать Псаммит (Исчисление песчинок) Архимеда. Но, собственно, это вне темы. Онлайн компрессоры работают хуже, чем то, что можно сделать в консоли :)

rustamych ★★★
() автор топика
Последнее исправление: rustamych (всего исправлений: 1)
Ответ на: комментарий от rustamych

Исходники при копировании почему-то поломались, все графики, но часть глав сохранилась, побились только первых две, где формул очень мало. В свое время не проверил, а сейчас глянул и ахнул.

Ну наконец-то всё разъяснилось. Просто восстанови из бекапа.

anonymous
()
Ответ на: комментарий от anonymous

Ты дегенерат, или как?

Но я вот сомневаюсь, что они при копировании поломались, скорее новый носитель попортился.

anonymous
()
Ответ на: комментарий от anonymous

Маня, тебе ж сказано — это лет 15 назад было, кто тогда бэкапы делал и куда, а?! носители дорогущие.

anonymous
()

ву а ля

Кстати, дед, а ты французский знаешь? когда ты в школе учился, его ещё преподавали массово, или уже вытеснили немецким?

anonymous
()
Ответ на: комментарий от anonymous

Машка, ты за клиента-то не расписывайся. Пусть сам расскажет про бекапы.

А 15 лет назад был 2004 и пачка дискет стоила 100р, CDWO 50р, CDRW 100.

anonymous
()
Ответ на: комментарий от anonymous

Да нету бэкапов. Сейчас благодаря облакам, все имеется на нескольких компах и в самом облаке, а тогда (2004 год) не делали бэкапов. Как то странно поломались файлы при копировании, а я и не заметил, точнее не проверил. Все epsки и первые две главы текста, без формул, только ссылки. Но вот добрый человек выше посоветовал psrip и все epsки выдернул. Сейчас сделаю маленькие pdfки и все будет ок.

rustamych ★★★
() автор топика
Ответ на: комментарий от anonymous

К сожалению французским не владею, только аглицкая и португальская мови. В школе был немецкий, но был полным балбесом и не учил его, а зря. А вот дедом пока не стал :), взрослые дети не хотят, а малым рано.

rustamych ★★★
() автор топика
Ответ на: комментарий от anonymous

В то время мы пользовались какой-то оболочкой для emtexa, но вот не помню названия. Она не делал бэкапы по умолчанию, а мы и не замарачивались, просто хранили копии на дискетах. Я, собственно, и не думал, что через 15 лет может понадобится, но вот ведь и понадобилось.

rustamych ★★★
() автор топика
Ответ на: комментарий от rustamych

Хорошо, перегнать в 16-ти цветный растр - 150 dpi? По одним только графикам, без фоток никто не заметит что у тебя только 16 цветов. А только потом применить сжатие?

cvv ★★★★★
()

Забавно! Посмотреле тут как раз wrapfig.sty, он как раз 2003-го года, автор уже покойный, в конце интересная штука:

Test file integrity:  ASCII 32-57, 58-126:  !"#$%&'()*+,-./0123456789
:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~

Это против таких вот казусов с испорченными файлами? Они тогда часто были, выходит? Дискеты-то легко размагничивались, и коррекции ошибок там толком не было...

anonymous
()

Попробуй ps открыть в inkscape. Если откроется - просто отредактируй всё, что нужно.

Stanson ★★★★★
()

Забыл одну тонкость - после открытия в inkscape возможно надо будет сделать Ungroup, потому что страница может быть одним объектом.

Stanson ★★★★★
()

Ищи/восстанавливай исходники /thread

Кстати, а нужен именно pdf? Если нет, то DjVu не сильно высокого растра даст выигрыш.

В принципе если есть исходный PostScript, то в нём можно вручную в текстовом редакторе поковыряться и порезать лишние картинки.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 2)
Ответ на: комментарий от Evgueni

Спасибо. Я по совету выше все картинки уже вытащил в секунду с помощью psrip. Сейчас сделаем первую часть, там всего 5 страниц без формул, только ссылки, остальные части к счастью не поломались. Вот картинки все побились, но теперь восстановлены. Затем уменьшу все картинки, gimp уменьшает почти в 20 раз лучше по сравнению с epstopdf. Итоговый файл, я думаю, будет нужного размера. Нужен именно pdf.

rustamych ★★★
() автор топика
Последнее исправление: rustamych (всего исправлений: 1)
Ответ на: комментарий от cvv

Я так сейчас и делаю. Цвета нет совсем, все ч/б. Если epstopdf делает из eps в 160кб -> 120кб pdf, то gimp делает всего 6Кб. В 20 раз меньше. Качество пониже, но в формате 8смх8см вполне нормально.

rustamych ★★★
() автор топика
Ответ на: комментарий от Stanson

Это верно. Я давно заметил, что иногда inkscape сильно уменьшает размер pdf. Достаточно просто открыть и сохранить под другим именем. Так же и в gimp.

rustamych ★★★
() автор топика
Ответ на: комментарий от anonymous

Такое я видел, но не знаю что это. Такую порчу файлов я как то не наблюдал, это в первый раз. Если его посмотреть, то там как в бинарнике набор крякозябров. Может действительно дискета от старости посыпалась, не знаю. Важно, что ps всего диссера остался целый и есть psrip.

rustamych ★★★
() автор топика
Ответ на: комментарий от rustamych

Тогда тебя спасет монохромный растр с обычным DPI. А может и оттенки серого проканают...

cvv ★★★★★
()
Ответ на: комментарий от rustamych

Некоторый программы (от Adobe в частности) любят добавлять дополнительную информацию в eps, например, растровую превьюшку для препросмотра в этих самых программах — эти добавки можно безболезненно выкидывать. Что именно меняется IMHO проще посмотреть в текстовом редакторе.

PDF же так не посмотришь, но там можно поменять степень сжатия (более новые версии PDF стандарта поддерживают более высокие степени сжатия). Если же в PDF скидывается не вектор, а растр, то там тоже можно ситуацию улучшить, но чудес особых ждать не следует — за это придётся заплатить ухудшением картинки.

Evgueni ★★★★★
()
Последнее исправление: Evgueni (всего исправлений: 1)
Ответ на: комментарий от anonymous

О бэкапах тогда возможно думали гораздо больше (где бэкапы, спрашиваете — на лентах!), чем сейчас и программ для разбивки архивов на дискетки с избыточностью тоже было предостаточно — приходилось регулярно пользоваться.

Evgueni ★★★★★
()
Ответ на: комментарий от Evgueni

Да все верно. У меня это в первый раз такое. Но вот сейчас уменьшил картинки, получился итоговый pdf размером 1.1Мб. Причем качество очень даже неплохое. В общем своего достиг и файлы восстановил и размер уменьшил. Одна из eps картинок вытащилась битой с помощью psrip, но pdfimages вытащил ее без всяких дефектов.

rustamych ★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.