LINUX.ORG.RU
ФорумAdmin

wget -r


0

1

Надо сделать миррор сайта пишу wget -r site.name в индексе есть ссылки вида href=/link так wget создает файл link. Как его заставить создавать папку с именем link а в нем файл index.html с содержимым. Изучая man wget пришел к выводу что никак. Может я что-то упустил.

$ curl -s http://localhost/index.html
<a href="/about">about</a>
$ curl -s http://localhost/about/index.html
Hello!
$ wget -r http://localhost/index.html
--2010-09-06 00:00:27--  http://localhost/index.html
Resolving localhost... 127.0.0.1
Connecting to localhost|127.0.0.1|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 27 [text/html]
Saving to: “localhost/index.html”

100%[======================================>] 27          --.-K/s   in 0s      

2010-09-06 00:00:27 (1018 KB/s) - “localhost/index.html” saved [27/27]

Loading robots.txt; please ignore errors.
--2010-09-06 00:00:27--  http://localhost/robots.txt
Reusing existing connection to localhost:80.
HTTP request sent, awaiting response... 404 Not Found
2010-09-06 00:00:27 ERROR 404: Not Found.

--2010-09-06 00:00:27--  http://localhost/about
Reusing existing connection to localhost:80.
HTTP request sent, awaiting response... 301 Moved Permanently
Location: http://localhost/about/ [following]
--2010-09-06 00:00:27--  http://localhost/about/
Reusing existing connection to localhost:80.
HTTP request sent, awaiting response... 200 OK
Length: 7 [text/html]
Saving to: “localhost/about/index.html”

100%[======================================>] 7           --.-K/s   in 0s      

2010-09-06 00:00:27 (326 KB/s) - “localhost/about/index.html” saved [7/7]

FINISHED --2010-09-06 00:00:27--
Downloaded: 2 files, 34 in 0s (709 KB/s)
$ cd localhost/
$ find .
.
./index.html
./about
./about/index.html

Какая у вас версия wget?

edigaryev ★★★★★ ()
Ответ на: комментарий от edigaryev

У вас веб сервер на запрос http://localhost/about 301 http://localhost/about/ ответил поэтому все OK. А если ссылка была вида href=index.php?key=value? то wget сделал бы файл index.php?key=value а не папку.

Spinel ()
Ответ на: комментарий от edigaryev

В http ytn понятия файл, каталог есть понятие html... документ

Spinel ()
Ответ на: комментарий от Spinel

>Смущает что если это потом дать апачу он не сможет обработать файл index.php?key=value

Ну так изначально же вопрос был совсем другой :)

Смотрите опцию --html-extension.

edigaryev ★★★★★ ()
Ответ на: комментарий от edigaryev

опция --html-extension просто добавит .html и полуится index.php?key=value.html а ссылка останется href=index.php?key=value т.е. работать не будет.

Может я немного сумбурно сформулировал. Задача сделать статическое зеркало динамического сайта. Что бы полученные от wget файлы можно было скормить апачу. Ссылки имеют вид href=index.php?key=value и href=link

Spinel ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.