LINUX.ORG.RU
ФорумTalks

[Ненависть и Отвращение] Реально ли сконвертировать сложный doc->html


0

0

Так уж сложилось, что в программе (кроссплатформенной, Qt4) необходимо показать сложный doc файл (с таблицами и сносками). Первое что я сделал - взял OOo и сконвертировал в html. На выходе получился практически plain text, без таблиц. Надев защиту, сконвертировал файл в word2003. На выходе получился адский набор файлов, однако огнелис открыл его и показал всё корректно.

Как известно, в Qt есть QWebView, который использует webkit. Но при просмотре этого html проявились странные косяки - буквы начали налезать друг на друга (весна штоль?) и вообще смотрится это отвратительно. Есть ли ещё пути, как сделать из doc человеческий html? Руками не предлагать, есть файлы по 100 листов...

Вот тестовый проект http://rghost.net/1647542 левая кнопочка генерит простой текст, правая грузит html, сгенерённый вордом (файл есть среди исходиников)

Есть мысль, что можно отображать как PDF. Конвертнуть doc в PDF существует куча способов, самый надежный наверное - это с применением хорошей защиты в оффтопике поднять виртуальный PDF-принтер и в него же напечатать вордом. Но есть другой, наименее опасный для здоровья способ - открыть в OOo и экспортировать PDF.

Далее, тролли написали статью о том, как этот PDF отображать в Qt: http://doc.trolltech.com/qq/qq27-poppler.html

На первый взляд там всё замудрено, но думаю что если разобраться - то не так уж сложно.

aix27249 ()
Ответ на: комментарий от aix27249

По сравнению с HTML, у PDF есть огромный плюс: он будет отображаться везде одинаково. А с HTML пляски с оформлением будут всегда, особенно в конвертированных документах.

aix27249 ()

Какой-то у тебя неправильный опенофис...

stein_ ()

Переслать doc себе на gmail ящик и нажать кнопочку просмотреть как HTML

pilotys ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.