LINUX.ORG.RU

[wget] непростые загрузки

 


0

0

Необходимо через wget загрузить файл, есть Интернет-страницы, ссылки на загрузки с которой/ых, как понимаю как-то генерируются и перенаправляются на другой адрес (как-то так%)

в общем, вот http://www.elementary-project.com/downloads.html
там кнопки Download, если посмотреть код страницы или в том же браузере скопировать ссылку - копируется
http://www.deviantart.com/download/65437279/elementary_Icons_by_DanRabbit.zip

затем вбивая в строке
wget -c http://www.deviantart.com/download/65437279/elementary_Icons_by_DanRabbit.zip
получим: «Запрос HTTP послан, ожидается ответ... 403 Forbidden»

если же будем загружать через firefox (не через wget, просто средствами лисы), загружается все как надо, НО совершенно с другого адреса

И, вопрос как все таки подобного рода ссылки можно/надо вбивать во wget ?

★★★★★

подставь реферер, юзер-агент, куки (нужно проверить, что именно)

Deleted
()

Проверил

curl -IL http://www.deviantart.com/download/65437279/elementary_Icons_by_DanRabbit.zip

Идёт по цепочке ссылок, в конце — искомый архив. Команда

curl -OL http://www.deviantart.com/download/65437279/elementary_Icons_by_DanRabbit.zip

его нормально скачала. Попробовал поиграть с юзер-агентом:

wget http://www.deviantart.com/download/65437279/elementary_Icons_by_DanRabbit.zip --user-agent='хрень'

нормально качает.

Вывод: Deviantart от большого ума запретил использование Wget. Как и большинство подобных запретов, он легко обходится.

question4 ★★★★★
()

он может отличить браузер от качалки, обычно обходится user-agent'ом. Выше question4 уже показал пример.

alex_custov ★★★★★
()

спасибо

--
Хотел спросить, выходит, если качалками запретили пользоваться не знаете случаем, если пользоваться это не будет каким-нибудь правам/лицензиям/соглашениям противоречить ?
(вопрос скорее наверно к знатокам девиантарта)

NK ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.