HELP! Рекурсивно запросить URL

0

1

Есть странная задачка: нужно выдернуть из файла миллион URL-ов, по одному скормить их сайту (просто http-запрос сделать с этим URL), для каждого такого хттп-запроса убедиться, что сайт ответил, но не дожидаться полного ответа сайта (он будет мегабайт на пять), а проверить, что в первых XYZ байт ответа есть определённое ключевое слово, после чего оборвать соединение.

Чем бы это получше сделать ? Я слишком слабо знаю всякие bash-и и прочее, поэтому прошу помощи.

Спасибо заранее!

Ссылка

← Проверить, находится ли в дисководе VCD\DVD диск

thread-safe модули apache →

Ключевое слово одно на все URL'ы?

edigaryev ★★★★★
(26.08.10 11:58:42 MSK)

Ответ на: комментарий от edigaryev 26.08.10 11:58:42 MSK

Да, стандартное. Если его нет в первых строках хттп-ответа, то выдать варнинг

gregg128
(26.08.10 12:00:18 MSK) автор топика

Ссылка

какую базу данных парсим? Беслпатный доступ к журналам, базе телефонов, паспортов, конкурентов?

annoynimous ★★★★★
(26.08.10 12:10:57 MSK)

man curl

Viglim ★
(26.08.10 12:13:38 MSK)

Ссылка

curl --range в цикле в купе с грепом

Nao ★★★★★
(26.08.10 12:18:26 MSK)

Ссылка

Ответ на: комментарий от annoynimous 26.08.10 12:10:57 MSK

2 annoynimous Эх, если бы это была база данных. Хрен там..

Короче, всем кто по делу ответил - спасибо.

gregg128
(26.08.10 12:36:57 MSK) автор топика

Ссылка

только при чем тут рекурсия, если у тебя банальный цикл?

nu11 ★★★★★
(26.08.10 14:02:25 MSK)

Ссылка

HTTP HEAD? curl --head

true_admin ★★★★★
(26.08.10 15:28:57 MSK)

Ответ на: комментарий от true_admin 26.08.10 15:28:57 MSK

2 true_admin О! Щас попробую.

anonymous
(26.08.10 16:53:00 MSK)

Ссылка

Ответ на: комментарий от true_admin 26.08.10 15:28:57 MSK

> HTTP HEAD

HEAD тело запроса не возвращает.

проверить, что в первых XYZ байт ответа есть определённое ключевое слово

sjinks ★★★
(27.08.10 08:21:28 MSK)

Ответ на: комментарий от sjinks 27.08.10 08:21:28 MSK

wooops

true_admin ★★★★★
(27.08.10 10:40:44 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Проверить, находится ли в дисководе VCD\DVD диск

thread-safe модули apache →