LINUX.ORG.RU

pdf 2 img (ghostscript)


0

1

Всем привет, столкнулся с неприятной проблемой. Опишу задачу, необходимо сконвертировать тонну pdf-ок в img файлы (jpg/png).

Начал пробовать с простого convert (imagemagick), и все работало хорошо для некоторых файлов. Но 90% файлов не хотят конвертироваться, выдает такую ошибку:

pechorin-andreys-MacBook-Pro:lib rbdev$ convert local.pdf result.jpg
   **** Warning:  File has an invalid xref entry:  67.  Rebuilding xref table.
   **** Warning: stream Length incorrect.
   **** Unknown operator: endob?Ɠl??؉̒|???X??8?@u
   **** Unknown operator: ?r?
   **** Unknown operator: Yy????,?$j0??'?
Error: /syntaxerror in --run--
Operand stack:
   --dict:6/6(L)--   --dict:52/52(ro)(L)--   PageSpotColors   --dict:0/0(L)--   --dict:1/4(L)--   292652   (\266O\255\035C\366\026\330\321\001\261\371C!\306\340)   68   0   --dict:6/6(L)--   (\0339G\250\332\326\021\311#@;/\3674\002\004Fw\262\212\021E\324,\252x\245@`!\t\003\204\017\b\004\336\325C\243\314'|\320\336\304\250\024|\271\231 \354\225\226\201/\024\343\231\313\3457\020\246\026\354\211\213\2432&7\212\330U\231\006!>,\341\242\356\323\035\005\034T\324\345m\365\264\227\224\237\322\254\220\277\177\026\251\001\016\237\233\316\260\342\264*?\375\300s\002\216\325Z9\032kJbak\177\257W\021 c=\207y\0273\016F`\361\271!3Y>8\245\n\007\202\317\274\300h\345$\336\344`\033\2451\250\316 \336\273\257\202\t\352\241\271U\317UgQkK\311\256PIQ\371*I\375\007\363^\n\306\200\216\250...)   (\266O\255\035C\366\026\330\321\001\261\371C!\306\340)   --dict:12/12(ro)(G)--
Execution stack:
   %interp_exit   .runexec2   --nostringval--   --nostringval--   --nostringval--   2   %stopped_push   --nostringval--   --nostringval--   --nostringval--   false   1   %stopped_push   1894   1   3   %oparray_pop   1893   1   3   %oparray_pop   1877   1   3   %oparray_pop   --nostringval--   --nostringval--   5   1   27   --nostringval--   %for_pos_int_continue   --nostringval--   --nostringval--   --nostringval--   --nostringval--   --nostringval--   --nostringval--   %array_continue   --nostringval--   --nostringval--   --nostringval--   --nostringval--   false   1   %stopped_push   --nostringval--   %loop_continue   --nostringval--
Dictionary stack:
   --dict:1157/1684(ro)(G)--   --dict:1/20(G)--   --dict:82/200(L)--   --dict:82/200(L)--   --dict:108/127(ro)(G)--   --dict:295/300(ro)(G)--   --dict:25/30(L)--   --dict:3/6(L)--
Current allocation mode is local
Last OS error: 2
GPL Ghostscript 9.01: Unrecoverable error, exit code 1
convert: Postscript delegate failed `local.pdf': No such file or directory @ error/pdf.c/ReadPDFImage/663.
convert: missing an image filename `result.jpg' @ error/convert.c/ConvertImageCommand/2960.

Гуглил и находил причину такого поведения в отсуствии шрифтов, но когда не хватает какого-то шрифта его название можно увидеть в листинге еррора. тут такой ошибки не присуствует. Что посоветуете делать? Переделать pdf-ки возможности нет, а сконвертировать их надо =( Я так понимаю любая конвертилка pdf2* работает через GS.

P.S. пробовал конвертировать и на мак-оси и на debin'е -> результат один и тот же =/


Ответ на: комментарий от aix27249

оно тоже использует ghostscript? щас тогда поставлю и попробую.

ciss ()

ну первую страницу гимп открыл и экспортировал нормально, думаю проблема в какой-нибудь странице. Перебрать даже 40 штук руками как-то лень.

Попробовал утилиту pdftotext, естественно все русские буквы экспортировались как иероглифы (указал кодировку как utf-8, так и koi8-r).

Буду смотреть в сторону всяких pdftk, оно вроде умеет делаеть repair'инг, хотя чего там репейрить я понятия не имею.

ciss ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.