LINUX.ORG.RU

[pdf][кодировка?]Можно ли изменить кодировку текстового слоя в pdf?

 


0

2

Суть в том, что есть pdf с текстовым слоем, но когда пытаюсь из него копировать, то получаю иерогрифы. Так же не работает поиск по файлу из-за этого. Можно ли как-то конвертировать этот текстовый слой?

★★★★

Не всегда возможно. В PDF нет понятия кодировки, на сколько я помню, коды символам могут быть даны произвольном в порядке.

sdio ★★★★★
()

Сталкивался с таким. Проще всего использовать OCR. Такая вот печаль...

Axon ★★★★★
()

Ответы:

а) можно

б) в основном это делается при создании документа

Evgueni ★★★★★
()
3 ноября 2012 г.

pdftotext -enc Latin1 file.pdf file.txt какого-то хрена кириллица во внедренном шрифте находится в latin1 (cp1252)

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.