[Python][urllib2]Перенаправление запроса на сервере и докачка файлов

0

1

Приветствую.

Пишу простенькую файлокачалку с использование urllib2. Просто закачка уже работает, теперь хочу добавить докачку частично скачанных файлов.

Проблема в том, что из-за перенаправления запроса на сервере, изначально, имя скачиваемого файла не известно и я не могу определить скачан ли он уже или нет. В голову приходит сначала делать пробный запрос определять имя файла, его наличие и длину и на основе этих данных принимать решение о необходимости формирования второго запроса с заголовком «Range». Вопрос: насколько правилен и корректен такой подход с точки зрения нагрузки на сервер? Существуют ли другие способы решения это проблемы?

Если это важно, то качалка будет заниматься вытягиванием альбомов с Jamendo в oggvorbis формате по ссылкам вида http://www.jamendo.com/get/album/id/album/archiverestricted/redirect/${album_id}/?p2pnet=bittorrent&are=ogg3.

По поводу wget — он не подошел по двум причинам: во-первых из-за перенаправления не может правильно определить имя файла; во-вторых лишняя сущность при наличии urllib2 в стандартной библиотеке; в-третьих хочется разобраться с принципами организации протокола HTTP.

Ссылка

← компонентные фреймфорки?

[Perl5] Конфиги →

там же есть что-то типа RedirectHandler, в нем проверить, например

hizel ★★★★★
(25.03.11 09:31:08 MSK)

Ответ на: комментарий от hizel 25.03.11 09:31:08 MSK

или в mechanize точно есть, можно оттуда взять

hizel ★★★★★
(25.03.11 09:41:19 MSK)

Ссылка

Ответ на: комментарий от hizel 25.03.11 09:31:08 MSK

>RedirectHandler

Эммм… Что-то я не очень понимаю как он поможет избежать дополнительного запроса? Еще раз, с самим перенаправлением и определение имени скачиваемого файла проблем нет. Меня интересует, можно ли определить скачан файл уже или нет без дополнительного запроса?

mechanize

Так это ж отдельная библиотека, в моем случае однозначный overkill.

fat_angel ★★★★★
(25.03.11 10:10:53 MSK) автор топика

Ответ на: комментарий от fat_angel 25.03.11 10:10:53 MSK

делай запрос с разу с ренжем 0- Ж) Заодно и узнаешь поддерживает ли http-сервер докачку :)

Jetty ★★★★★
(25.03.11 11:02:09 MSK)

Ответ на: комментарий от Jetty 25.03.11 11:02:09 MSK

Оно конечно можно, но я не совсем понимаю, что мне это даст. Вот я обнаружил, что у меня половина файла скачалась, а сервер мне выдал его целиком и что дальше делать? seek()-методы разве работают с HTTP?

Прошу прощения за столь дурацкие вопросы, раньше с HTTP не сталкивался.

fat_angel ★★★★★
(25.03.11 12:07:21 MSK) автор топика

Ответ на: комментарий от fat_angel 25.03.11 12:07:21 MSK

Нет, я к тому что «скачай» предположим 10 байт начиная с 10-го :)
Таким образом ты убъешь 2 зайцев - узнаешь имя файла и узнаешь поддерживает ли сервер докачку :)

Jetty ★★★★★
(25.03.11 12:17:45 MSK)

а хранить где-нибудь имена недокачанных фалов с ранжами совсем нельзя?

и потом посылать запрос с ранжем и обрабатывать ошибки?

hotaru
(25.03.11 12:43:19 MSK)

Ответ на: комментарий от Jetty 25.03.11 12:17:45 MSK

>узнаешь имя файла и узнаешь поддерживает ли сервер докачку

Сервер у меня только один — jamendo.com и он поддерживает докачку. Поэтому не вижу смысла делать дополнительную проверку. Все что мне нужно — это имя файла.

fat_angel ★★★★★
(25.03.11 12:48:08 MSK) автор топика

Ссылка

Ответ на: комментарий от hotaru 25.03.11 12:43:19 MSK

>а хранить где-нибудь имена недокачанных фалов с ранжами совсем нельзя?

Можно, но тогда моя наколенная поделка потихоньку начнет перерастать в нечто более серьезное, а этого хотелось бы избежать. Ведь jamendo'вский апи для закачки ogg'а может быть в любой момент поломан или даже отключен. Хотя это конечно будет наиболее красивым решением.

fat_angel ★★★★★
(25.03.11 12:53:47 MSK) автор топика

Ответ на: комментарий от fat_angel 25.03.11 12:53:47 MSK

Задавай только нижнюю границу диапазона, наподобие [code]Range: bytes=1024-[/code] http позволяет. с именем все равно ничего не придумаешь (если не хочешь его сохранять), пока тебе его сервер не скажет.

hotaru
(25.03.11 13:44:49 MSK)

Ответ на: комментарий от hotaru 25.03.11 13:44:49 MSK

~~ммать! привет LORCODE~~

hotaru
(25.03.11 13:45:24 MSK)

Ссылка

Ответ на: комментарий от hotaru 25.03.11 13:44:49 MSK

>с именем все равно ничего не придумаешь (если не хочешь его сохранять), пока тебе его сервер не скажет.

Понятно, я примерно так и думал, хотел уточнить просто. А на счет диапазонов — когда имя файла будет известно, определить диапазон из длинны этого файла для нового запроса по-моему не проблема.

fat_angel ★★★★★
(25.03.11 13:55:09 MSK) автор топика