LINUX.ORG.RU

wget - скачивание каталогов с левым index.* ?


0

0

нужно качнуть файлы вот отсюда: http://www.helding.net/greeklatinaudio/

wget пытается получить index.*, в котором написано 404, и на этом обламывается, хотя

curl http://www.helding.net/greeklatinaudio/
…
<img src="/icons/folder.gif" alt="[DIR]"> <a href="greek/">greek/</a>                  04-Apr-2008 23:28    -   
<img src="/icons/folder.gif" alt="[DIR]"> <a href="hebrew/">hebrew/</a>                 13-Jul-2006 09:58    -   
<img src="/icons/folder.gif" alt="[DIR]"> <a href="latin/">latin/</a>                  05-Apr-2008 22:08    -   

указание пустого --default-page= не помогает, wget тупо не работает, другого способа не вижу.

aria тупит точно так же.

помогайте.

Хм... С индексами всё нормально. Проблема только в том, что wget по умолчанию принимает во внимание содержимое robots.txt, а там запрет на спуск в /greeklatinaudio/. Лечится примерно так:

wget -e robots=off -r http://www.helding.net/greeklatinaudio/

Deleted ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.