LINUX.ORG.RU

декодирование pdf с кривыми встроенными шрифтами

 ,


0

3

имеется некоторая пдфка, в которую криворукие дятлы запихали встроенные шрифты в кастомной кодировке. Вопрос в том, как бы его назад «декодировать» (а именно: сделать возможным поиск по документу)

Собственно, сам документ. Прошу поручиков сильно не ржать на тему содержимого.

★★★★★

В браузере читать можно. Поиск, естественно, толком не работает. Вообще, насколько я понимаю, встроенный шрифт с кастомной кодировкой исправить невозможно, только через OCR.

А что, если использовать другой источник? Вот хороший сайт: http://www.sigtura.ru/load2.php?id=31

anonymous
()

Можно попробовать при помощи GhostScript

sudo apt-get install ghostscript

вот команда:

gs -sDEVICE=pdfwrite -o output.pdf input.pdf

Уже не помню, давно, таким способом вылечил файл. Но иногда, бывает что некоторые символы не видит. Кстати тот файл по ссылке, хром открывает нормально, правда хз, где там можно кодировку посмотреть.

styxriver
()
Ответ на: комментарий от anonymous

Дык а толку? Там источник один - ВАЗ, а они пдфку готовили только для бумажного вида.

demidrol ★★★★★
() автор топика
Ответ на: комментарий от styxriver

Да отображается он нормально, только там шрифты акробат дистиллер покоцал. Поиск полнотекстовый по файлу не работает.

demidrol ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.