LINUX.ORG.RU

Парсер веб-страниц.


0

1

Какой язык больше подходит для скрипта, чтобы он, например, открыл веб-страницу, допустим, Google.ru и ввел какой-нибудь запрос в поле поиска... А-ля сетевой бот. Нужен парсер html/php, я так понял. И да, кстати, как работают подобные сетевые боты? Например, для регистрации на сайтах. Для борьбы с которыми и были введены визуальные числа.

Ответ на: комментарий от anonymous

Только php? Я знаю есть утилитка в консоли wget --spider. Но она по-моему слабовата?

OpenSourceTrojan ()
Ответ на: комментарий от OpenSourceTrojan

для многих популярных ЯП имеются xml/html-парсеры, вам какой нужен?

anonymous ()
Ответ на: комментарий от OpenSourceTrojan

ну sed/awk/grep, для получения и отправки естественно wget и curl

anonymous ()
Ответ на: комментарий от OpenSourceTrojan

ну хоть бы для приличия пошел почитал чего-нибудь, а?

впрочем, вот тебе код ввода текста в гугл

wget -U "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7) Gecko/20040613 Firefox/0.8.0+" http://www.google.com/search?q=что+такое+http
belka ()

Самый простой мне кажется это модуль htmldata для питона.

firestarter ★★★☆ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.