LINUX.ORG.RU

pdf to txt


0

0

Есть такая задача: конвертировать 100-мегабайтный pdf-файл, состоящий из отсканированного, но не распозанного текста (т.е. просто картинки, загнанные в pdf), в plain-text. У меня под cxoffice стоит ABBYY FineReader Sprint 5.0. Но он, похоже, pdf открывать не может. Тогда нужно как-то перегнать pdf в картинку и только тогда распознавать.

Внимание вопрос: Как сделать pdf => bmp или что-нибудь похожее?

★★★★

Re: pdf to txt

ghostscript

anonymous
()

Re: pdf to txt

Самый простой способ - 6-й FineReader.
И больше таких глюпых pdf не делай :)
Для нераспознанного текста хорош djvu

Shadow ★★★★★
()
Ответ на: Re: pdf to txt от Shadow

Re: Re: pdf to txt

>Самый простой способ - 6-й FineReader.

Только он у меня под crossover office не ставится :(

K48 ★★★★
()
Ответ на: Re: pdf to txt от jackill

Re: Re: pdf to txt

Спасибо, но: Error: Copying of images from this document is not allowed.

Что делать?

K48 ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.