LINUX.ORG.RU

Pdf/Docx/Xlsx

 


0

1

Всем привет! Есть шара в шаре папка с документами разных типов. В документах есть контакты овердофига. Как можно сделать выхлоп только по определенным строкам например вытащить email

Нужна какая-нибудь утилита которая вытащит текст из твоих файлов, например Apache Tika.

maxcom ★★★★★
()
Ответ на: комментарий от ValdikSS

даже не знал , что такое бывает - буду пробовать спасибо

hehe9ooo
() автор топика

например вытащить email

Если строки вытащил, можно отобрать адреса или то, что на них похоже

#!/bin/sed -Ef

  /[-._[:alnum:]]+@([-[:alnum:]]+\.)+[[:alpha:]]{2,}/!d
  s/[<>]/#/g
  s/([-._[:alnum:]]+@([-[:alnum:]]+\.)+[[:alpha:]]{2,})/<\1>/g
  s/>[^<]*</\n/g
  s/[^<]*<//
  s/>.*//
Deleted
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.