LINUX.ORG.RU

Обойти рекурсивно сайт

 , ,


0

2

Здравствуйте, нужно не закачивая сайт, обойти его рекурсивно, и выдрать всё, что находится между тегами, допустим между <h1>...</h1> и соответственно, результаты записать в файл.Страницы закачивать не нужно, слишком жирно.
Чем и как бы всё это организовать? Я так понял, что с вгетом это плохо получится?