LINUX.ORG.RU

Поиск pdf файла по тексту


0

1

Имеется ~200 файлов, нужно найти файлы,содержащие определённые слова.
Поа на ум пришло только конвертнуть всё в текст и искать по нему, но может есть какое-то готовое решение?

beagle (но все равно сначала надо будет проиндексировать).

А сразу можно конвейером pdftotext | grep

Eddy_Em ☆☆☆☆☆ ()

pdfgrep - search in pdf files for strings matching a regular expression

sdio ★★★★★ ()

Если они не от'OCR'ены, то простых решений не будет, да.

Frakhtan-teh ★★ ()
Ответ на: комментарий от Frakhtan-teh

pdf-ки сделаны ручками.
В принципе, уже прогнал всё через pdftotext и поискал по получившимся файлам.

rap-kasta ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.