PDF->TeX

Вы хотите невозможного.

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.11 13:05:17 MSK)

Ответ на: комментарий от Eddy_Em 15.01.11 13:05:17 MSK

Мы рождены, чтоб сказку сделать былью(с):)

~~pylin~~ ★★★★★
(15.01.11 13:14:25 MSK) автор топика

Ответ на: комментарий от pylin 15.01.11 13:14:25 MSK

Вы даже платную «распознавалку» не найдете, которая смогла бы вам из сложного текста с формулами, картинками, сносками и т.п. генерировать полноценный латеховский файл. Технология ИИ до этого еще не дошла!

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.11 13:17:15 MSK)

Ответ на: комментарий от Eddy_Em 15.01.11 13:17:15 MSK

Я извиняюсь, но:

При чем здесь ИИ? Мы имеем ведь два формальных языка
На оба языка дана спека.
Значит можно составить вполне однозначный алгоритм перевода
Да проблема может быть в том что Adobeвская спека умалчивает детали формата
А для самого TeX проблема это подбор необходимых пакетов в режиме автомата

~~pylin~~ ★★★★★
(15.01.11 13:39:30 MSK) автор топика

Ответ на: комментарий от pylin 15.01.11 13:39:30 MSK

При чем здесь ИИ? Мы имеем ведь два формальных языка
На оба языка дана спека
начит можно составить вполне однозначный алгоритм перевода

Даю контрпример: у вас есть исходник на С и скомпилированный из него бинарник. Имеем два формальных языка, но еще никто не научился из бинарника получать грамотный сишный файл! В вашем случае - то же самое.

Да проблема может быть в том что Adobeвская спека умалчивает детали формата
А для самого TeX проблема это подбор необходимых пакетов в режиме автомата

Даже если бы формат был полностью открыт, без ИИ ничего не получится. Ну и конечно, подбор нужных пакетов тоже важен - как вы без ИИ определите, какой пакет будет лучше подключить?

Даже автоматическое генерирование списка литературы и предметного указателя - почти невыполнимая задача.

Блоки текста из pdf можно, конечно, «перевести» в латех, чтобы полностью сохранить внешний вид. Но редактировать такой файл вы не сможете. Попробуйте-ка открыть pdf при помощи ОО и попытаться его отредактировать...

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.11 13:48:09 MSK)

Ответ на: комментарий от Eddy_Em 15.01.11 13:48:09 MSK

> Попробуйте-ка открыть pdf при помощи ОО и попытаться его отредактировать...

Т.е. невозможно конвертировать pdf в редактируемый формат?

anonymous
(15.01.11 13:51:44 MSK)

Ответ на: комментарий от pylin 15.01.11 13:39:30 MSK

> Да проблема может быть в том что Adobeвская спека умалчивает детали формата

Сомневаюсь, что стандарт умалчивает.

anonymous
(15.01.11 13:54:05 MSK)

Ссылка

Ответ на: комментарий от anonymous 15.01.11 13:51:44 MSK

В полноценный редактируемый формат - невозможно.

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.11 13:55:02 MSK)

Ответ на: комментарий от Eddy_Em 15.01.11 13:55:02 MSK

> В полноценный редактируемый формат - невозможно.

Поясните, пожалуйста.

anonymous
(15.01.11 13:56:19 MSK)

Ответ на: комментарий от anonymous 15.01.11 13:56:19 MSK

В латеховый файл, который можно будет легко читать и полноценно править. А не так, как это делается в том же ОО - либо можно поправить только одно-два слова, либо же вручную придется все блоки с текстом выравнивать...

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.11 13:58:22 MSK)

Ссылка

Ответ на: комментарий от Eddy_Em 15.01.11 13:48:09 MSK

Стоп стоп. Пример с бинарником некорректен, здесь идет преобразование с потерей информации. Ведь в бинарнике уже нет никаких данных специфичных для С(переменные, метки и прочее), нет уже той системы ссылок на функции как они были даны в исходнике. В конце концов здесь еще встает вопрос однозначного декодирования, читающим. Учитывая, что к тому же способов представления СИшной конструкции в асме много, то задача трудна. Однако та же технология FLIRT в IDA и некоторые расширения, написанные как аспирантские работы, позволяют по листингу получать С-описание функций из асма н и некоторую другую информацию для С.

Другой контрпример: ведь сейчас не является большим ноухау, то что преобразуется DOC<->ODF, однако форматы разные, но описывают одно и то же так сказать разным синтаксисом и структурой языка.

Еще пример: была у меня программа, которая конвертировала С-шеые хидеры в паскалевские заголовочные файлы. Языки разные, однако опять при преобразовании не происходит потери информации и есть возможность однозначного сопоставления.

Ну и самое забавное: написали же конвертор для преобразования PDF->doc, значит все же можно ?

~~pylin~~ ★★★★★
(15.01.11 14:06:40 MSK) автор топика

Ответ на: комментарий от pylin 15.01.11 14:06:40 MSK

И вполне все читабельно и редактируемо

~~pylin~~ ★★★★★
(15.01.11 14:08:03 MSK) автор топика

Ссылка

Ответ на: комментарий от pylin 15.01.11 14:06:40 MSK

Пример с бинарником некорректен, здесь идет преобразование с потерей информации.

Компилирование latex->pdf идет аналогично, с потерей информации.

ведь сейчас не является большим ноухау, то что преобразуется DOC<->ODF, однако форматы разные, но описывают одно и то же так сказать разным синтаксисом и структурой языка.

Неверное сравнение: doc и odf форматы выполняют примерно одно и то же. А вот попробуйте ка преобразовать pdf документ в корректный odt - ничего у вас не выйдет...

была у меня программа, которая конвертировала С-шеые хидеры в паскалевские заголовочные файлы. Языки разные, однако опять при преобразовании не происходит потери информации и есть возможность однозначного сопоставления.

Здесь тоже некорректное сравнение: мы имеем два исходника, пусть и на разных языках, но между ними несказанно больше общего, чем у исходника и скомпилированного из него бинарника.

Ну и самое забавное: написали же конвертор для преобразования PDF->doc, значит все же можно ?

Не сталкивался. Но считаю, что он не может работать корректно (с использованием стилей, автоматическими сносками, оглавлениями, списками литературы). Да те же формулы вы никак не сможете полноценно отобразить в doс-файле.

Хотя, простой текст преобразовать несложно - но для этого и простым pdftext'ом можно воспользоваться...

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.11 14:12:03 MSK)

Ответ на: комментарий от Eddy_Em 15.01.11 14:12:03 MSK

Оглавление было, список литры по-моему то же, а с формулами да есть проблема. Потом тут потеря не настолько масштабна как в вашем примере. Да и никто ж не ждет 100% конвертации,напильником работы никто не отвергает)

~~pylin~~ ★★★★★
(15.01.11 14:18:18 MSK) автор топика

Ссылка

Ответ на: комментарий от pylin 15.01.11 14:06:40 MSK

написали же конвертор для преобразования PDF->doc

Если pdf->doc получилось, дальше все элементарно :)

fluorite ★★★★★
(15.01.11 14:19:19 MSK)

Ответ на: комментарий от fluorite 15.01.11 14:19:19 MSK

Ну это некошерно по двум причинам: 1) Конвертор пропиетарный 2) Работает только под оффтопиком

~~pylin~~ ★★★★★
(15.01.11 14:22:11 MSK) автор топика

Ответ на: комментарий от fluorite 15.01.11 14:19:19 MSK

ОК. Вот вам два pdf-файла, скомпилированных из латеха: раз и два. Сможете сделать из них полноценный doc-файл с сохранением разметки, формул, автоматического предметного указателя и оглавления, да еще такой, который можно будет легко править вручную?

А сгенерировать потом из него латеховский документ, который тоже можно будет легко редактировать, не путаясь в бешеном количестве вложенных box'ов и всякими \cyrA вместо русских букв?..

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.11 14:24:20 MSK)

Ответ на: комментарий от pylin 15.01.11 14:22:11 MSK

Были какие-то onlain. А так ~~Eddy_Em~~ прав, задача в общем виде не решается.

fluorite ★★★★★
(15.01.11 14:26:04 MSK)

Ссылка

Ответ на: комментарий от Eddy_Em 15.01.11 14:24:20 MSK

>А сгенерировать потом из него латеховский документ, который тоже можно будет легко редактировать, не путаясь в бешеном количестве вложенных box'ов и всякими \cyrA вместо русских букв?..

OpenOffice вроде умел экспортировать в латех

Heretique ★
(15.01.11 14:28:35 MSK)

Ответ на: комментарий от Heretique 15.01.11 14:28:35 MSK

Наткнулся тут на то что это умеет AbiWord

~~pylin~~ ★★★★★
(15.01.11 14:31:50 MSK) автор топика

Ссылка

Ответ на: комментарий от Heretique 15.01.11 14:28:35 MSK

OpenOffice вроде умел экспортировать в латех

Вот про нечитаемость полученного «экспортного» файла я и говорил. Попробуйте простенький документ, не содержащий сложной разметки, таблиц и т.п. экспортировать из ОО в латех. Увидите, что руками проще.

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.11 14:31:57 MSK)

Ответ на: комментарий от Eddy_Em 15.01.11 14:31:57 MSK

Да но конвертация AbiWord оказалась нечитабельной. Придется делать руками

~~pylin~~ ★★★★★
(15.01.11 14:43:31 MSK) автор топика

Ссылка

Ответ на: комментарий от Eddy_Em 15.01.11 14:24:20 MSK

Кстати, в чем преимущество pdfetex перед pdflatex?

fluorite ★★★★★
(15.01.11 14:50:19 MSK)

Ответ на: комментарий от fluorite 15.01.11 14:50:19 MSK

Не знаю. Я pdflatex'ом пользуюсь. Чем e-TeX от обычного теха отличается - понятия не имею...

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.11 14:55:33 MSK)

Ответ на: комментарий от Eddy_Em 15.01.11 14:55:33 MSK

Ясно. Просто ваша pdf'ка pdfetex сделана...

fluorite ★★★★★
(15.01.11 14:59:31 MSK)

ABBYY pdf transformer, несвободный

dn2010 ★★★★★
(15.01.11 15:04:03 MSK)

Ссылка

Ответ на: комментарий от fluorite 15.01.11 14:59:31 MSK

Моя pdf'ка сделана как раз pdflatex'ом:

производитель: pdfTeX-1.40.3

Чтобы не ухудшать качество pdf перегоном latex->dvi->pdf, картинки я сохранял сразу и в eps, и в jpg (т.е. при «теховании» выбирались eps-файлы, а при использовании pdflatex'а - jpeg'и).

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.11 15:04:45 MSK)

Ссылка

Ответ на: комментарий от fluorite 15.01.11 14:50:19 MSK

> Кстати, в чем преимущество pdfetex перед pdflatex?

pdflatex = pdftex + latex-макросы, при этом pdftex = pdfetex.

reader ★
(15.01.11 15:09:53 MSK)

Ссылка

> PDF->TeX

Есть ли такой свободный конвертер?

Есть. рассказываю алгоритм;

а) открываете pdf в любом вьювере

б) читаете, кто автор и находите его контакты

в) пишите автору мотивированный запрос и просите выслать исходники

г) получаете исходники

д) профит

P.S. Да мотивация вида: «мне лень писать реферат самостоятельно» — мотивацией не является.

Evgueni ★★★★★
(15.01.11 21:28:49 MSK)

Ответ на: комментарий от Evgueni 15.01.11 21:28:49 MSK

Не угодали с мотивацией: перевод одной доки многостраничной на наш родной, а реферат проще самому написать, чем чужие косяки править

~~pylin~~ ★★★★★
(16.01.11 10:34:01 MSK) автор топика

Ответ на: комментарий от pylin 16.01.11 10:34:01 MSK

Ну тогда в чём проблема? Пиши автору.

Evgueni ★★★★★
(16.01.11 11:14:25 MSK)

Ссылка

Похожие темы