LINUX.ORG.RU

Точно есть библиотеки под это дело.

einhander ★★★★★
()

Был такой pdfedit еще на qt4, но он давно не обновлялся.

pandrey ★★
()

а если ли в ваших pdf вообще метаданные? помню, выковыривал распознанный текст с помощью pdftotext из состава poppler

Syncro ★★★★★
()

Vim. Пдф это обычный размеченный текст с пачкой дополнений типа стримов. Метадата обычно текстом идёт

upcFrost ★★★★★
()

pdf это 'текстовый'(ascii) контейнер в котором может быть «произвольный» битовый(бинарный) поток как содержимое (сжатие там али иной какой блоб) обтегированный нужными словами для передачи ридеру инфы как парсить последующий бинарный поток - иногда даже с валидным указаением какой длины сей бинарь

ну и в оконцове xref -

формата pdf если не углублятся в детали достаточно простой - есть кстати плееры(обычно на java реализованные от чего то ) которые позволяют посмотреть пошагово(прям по командно) отрисовку документа - достаточно позновательно

qulinxao3
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)