LINUX.ORG.RU

pdf в doc


0

1

Есть ли утилиты под линукс которые справляются с этой задачей? Именно pdf в doc и не иначе.

Что удалось нагуглить так это только shareware программы под винду.

Спасибо


pdf > tiff > cuneiform > doc

тебе вообще не приходило в голову, что если кроме shareware для такой задачи ничего нет, значит задача не совсем тривиальна?

vostrik ★★★☆
()

Открыть опенофисом и сохранить как .doc (только у вас получится совершенно нередактируемый текст - по одному блоку на каждую строчку).

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от tmlder

Вы скажите, зачем это вам надо? Если тупо, чтобы «отмазаться», то лучше всего - распустить pdf на страницы (например, png) и повставлять их в опенофисе, потом сохранить как .doc.

Если чтобы можно было редактировать - то текст можно получить при помощи pdftotext, картинки - при помощи pdfimages, потом все соединить.

Если серединка на половинку - опенофисом, как я выше говорил.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от tmlder

pdftotext file.pdf file.doc

коли в условии задачи ничего не сказано про картинки, etc.

p.s. или сейчас выяснится, что нужно соблюсти форматирование, формулы, рисунки и т.п. ??

swarnk ★★
()
Ответ на: комментарий от swarnk

что нужно соблюсти форматирование, формулы, рисунки и т.п. ??

В этом случае единственный надежный способ - мой (распустить pdf на страницы и повтыкать каждую ручками или скриптом в ОО, потом сохранить как .doc). Естественно, редактировать нельзя будет.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

Это нужно для того чтобы бы полученный сконвертированный pdf документ можно было редактировать в worde.

tmlder
() автор топика
Ответ на: комментарий от tmlder

Тогда забудьте. Либо выдерните текст из pdf (если он, конечно, с текстом) при помощи pdftotext и сохраните при помощи ОО как .doc, либо (если хотите поиздеваться над тем ..., который надумал редактировать pdf) - откройте pdf при помощи ОО и сохраните как .doc.

Да, если не секрет: что побудило вас задать такой, мягко говоря, глупый вопрос? pdf-то чем-то создавался? Куда оригинал дели?

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от tmlder

Ну только что попробовал открыть pdftotext test.pdf test.doc документ в word (прости господи). Открывается. Редактируется. Что дальше?

swarnk ★★
()
Ответ на: комментарий от vostrik

html или rtf это языки разметки а pdf это поток байт представляющий графический образ для печати на принтере. поэтому его можно только finereader-ом/OCR распознавать

Karapuz ★★★★★
()
Ответ на: комментарий от tmlder

полученный сконвертированный pdf документ можно было редактировать в worde


открой файл в Acrobat и скопируй все в Word

Karapuz ★★★★★
()
Ответ на: комментарий от Karapuz

открой файл в Acrobat и скопируй все в Word

Чем этот способ лучше открывания файла опенофисом и сохранения в формате .doc? Все равно ничего невозможно будет редактировать (точнее, можно, но с большими костылями). И разметка поплывет...

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от unikum

Судя по формулировке вопроса, у ТС линукс, а какому-то нехорошему человеку надо редактировать в мастдае pdf. И этот нехороший человек эти самые pdf где-то украл, т.к. исходников у него нет. Плагиат!

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от tmlder

О! Брависсимо! Я ждал этого вопроса.

Конечно нет. Про таблицы, форматирование вы в первом своем сообщении тактично умолчали....

swarnk ★★
()
Ответ на: комментарий от tmlder

Картинки, таблицы, форматирование осталось?

Если вам надо, чтобы это все осталось, да еще и в таком виде, чтобы можно было редактировать, да еще и чтобы не испортилось оформление документа, то мой вам совет: забудьте о своей нездоровой идее. pdf предназначен для чтения и печати, но никак не для редактирования.

Еще раз спрашиваю: куда исходники этого pdf'а дели?

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от tmlder

Я уже несколько раз просил, чтобы вы объяснили, зачем вам это понадобилось. Ответ был? Нет. Значит - плагиат!

Eddy_Em ☆☆☆☆☆
()

Нет. Потому что не нужно, тем более в какой-то док (это для докторов что ли?).
Ставь под винду что-нибудь типа адобепдфедит/фокситпдфедит.

amorpher ★★★★★
()
Ответ на: комментарий от tmlder

Даже сам себя процитирую

p.s. или сейчас выяснится, что нужно соблюсти форматирование, формулы, рисунки и т.п. ??

swarnk ★★
()
Ответ на: комментарий от swarnk

Поздравляю что дождались! Теперь можете задавать вопросы типа «Я что телепат?» или идти подстричься.

tmlder
() автор топика
Ответ на: Не айс/не юникс вей от kraftello

Спасибо за совет. Мне глубоко пофиг Unix вэй это или как-то другой. У меня есть задача, которую надо решить.

tmlder
() автор топика
Ответ на: комментарий от Karapuz

facepalm. а на выходе cuneiform у нас что, поток байт с картинкой пдфа замаскированный под html?

vostrik ★★★☆
()

Сделать скриншоты страниц PDF и вставить картинки в doc. Profit.

Редактировать можно GIMP-ом.

Nervous ★★★★★
()
Ответ на: комментарий от petrosyan

Спасибо за совет! Виндовое приложение под вайном тоже подойдет как вариант. Можете посоветовать какое? Чтобы freeware было.

tmlder
() автор топика
Ответ на: комментарий от tmlder

Почему бы вам не делать все через одно место, а редактировать то, из чего этот самый pdf был сгенерирован?

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от tmlder

>Можете посоветовать какое?

Adobe Acrobat (не Reader!)

Чтобы freeware было.

Пиратским воспользуйся, как обычно.

Led ★★★☆☆
()
Ответ на: комментарий от tmlder

>Проще найти free чем кряк

И где ты «free» Word нашёл?

Led ★★★☆☆
()
$yaourt -Ss pdf2
community/pdf2djvu 0.7.4-2
    Creates DjVu files from PDF files
aur/kpdf2 0.3.1-7 (19)
    An old version of KDE's PDF reader, made obsolete by Occular.
aur/pdf2html 1.4-3 (108)
    Converts pdf files to html files.
aur/pdf2line 0.0.1-2 (19)
    Simple command-line utility to convert PDF into text
aur/pdf2svg 0.2.1-3 (97)
    A pdf to svg convertor
kernelpanic ★★★★★
()

одной утилитой не выйдет,
попробуйте или предложенные уже в теме конвертеры в другие форматы, например текст или изображение, а можно просто попробовать в просмотрщике pdf скопировать данные в буффер и вставить в ООо writer

если текст , то открываете его в openoffice.org writer (например) и редактируете, сохранение в .doc там есть

если изображение, то можно воспользоваться распознавалками , cuneiform например, возможно удастся сохранить часть форматирования.

Sylvia ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.