LINUX.ORG.RU

[Help me!] Псосветуйте парсер


0

1

Чем можно распарсить html-страничку в консоли? Необходимо выдрать некоторые текстовые значения и вывести их в консоль. Кроме grep и cut ничего не знаю, но готовы выучить для такого дела. Заранее благодарю за ответ.


Ответ на: комментарий от silw

Вот для моей цели что лучше, sed или awk?

BSD
() автор топика
Ответ на: комментарий от isden

>lynx -dump

Целый браузер для этого дела слишком круто, хотелось бы стандартными средствами.

BSD
() автор топика

xml2

Если стандартными, то grep, awk, sed по вкусу.

GotF ★★★★★
()

Регулярки все равно придется использовать, так что перл, освоить чтение из файла и вывод результата займет малую часть времени по сравнению с изучением регулярок.

PoMbl4
()
Ответ на: комментарий от BSD

> Не, язык учить это слишком :)

> Кроме grep и cut ничего не знаю, но готовы выучить для такого дела.

ну, смотри сам. в таком случае пользуй sed и awk.

name_no ★★
()
Ответ на: комментарий от BSD

> Целый браузер для этого дела слишком круто, хотелось бы стандартными средствами.

есть мнение, что это будет менее ресурсоемко и более быстро чем использование кучки вызовов bash|sed|awk.

isden ★★★★★
()

html редко бывает валидным xml документом, так что все равно придется использовать регулярные выражения

note173 ★★★★★
()

html2text.

Регулярками HTML парсить крайне не рекомендуется.

JackYF ★★★★
()

На пхп это делается на 5 минут

drull ★☆☆☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.