LINUX.ORG.RU
ФорумAdmin

httrack по удаленке

 


1

1

Не могу сообразить, как рулить консольной httrack по удаленке с помощью веб-морды WebHTTrack Website Copier?

На локальном компе она обращается к httrack по адресу http://my_computer:8080/server/index.html

А если httrack на удаленном сервере, тогда как к ней обращатся?


Кажется, я что-то перепутал :)
Думал, что веб-морда взаимодействует с консольным httrack.
Но top показал совсем другое - на самом деле она работает соместно с иной утилитой - /bin/bash /usr/bin/webhttrack

И похоже, webhttrack работает как сервис.

Red7
() автор топика

Парни, помогите скачать сайт http://pivo.borda.ru :))

Какой-то он очень хитрый - какие только параметры в httrack не задаю, скачивается только главная страница сайта с названиями тем, а внутрь тем эта качалка не заходит и сообщает, что якобы скачала весь сайт.

Red7
() автор топика
Ответ на: комментарий от crutch_master

Хех :) Так я с wget и начал - не берет ни в какую!
Потом ради интереса даже виндовый Offline Explorer попробовал - тоже никак.
Потом еще что-то, уже не помню. Все они скачивают кусочек, но докладывают, что скачали весь сайт.

Вы бы не инструментарии подсказывали, я их и так знаю, а сами бы попробовали чем-небудь скачать.
Вангую, что и у вас не выйдет, или сходу не выйдет, говорю же, сайт - хитрый.

Всякие другие сайты скачиваю без запинки, а этот никак :(

Red7
() автор топика
Ответ на: комментарий от Red7

Потому что там данные передаются в скриптах и разворачиваются в DOM после того, как страница погрузится.

mo('goddy','Да погугли и найди в..','Да погугли и найди в интернете пивную карту Праги.. Этого в принципе и достаточно.. ТАм все необходимое есть.. вплоть до станций метро и трамваев. Я по ней 5 дней ходил и всех заведений не выходил.','С коллекционным приветом,  <BR> goddy <BR> <a target=_new href="http://deckel.sitecity.ru"><u>http://deckel.sitecity.ru</u></a>','1324','1333203000','2536','goddy','','0','001','2','','','1116585144','1','Украина','Донецк-Киев','73','только декели','21.02.1973','2','');
Т.е. всё он скачивает, просто ты ничего не видишь в голом html и надо еще придумать, как данные вытащить.

crutch_master ★★★★★
()
Ответ на: комментарий от crutch_master

Как же всё, я вижу, что файлов скачивается совсем немного как по числу, так и по объему.

Хорошо, пусть даже всё, и что же теперь делать?

Red7
() автор топика
Ответ на: комментарий от crutch_master

Всего 40 кб? Это же далеко не все (имхо), там много тем, в каждой по несколько страниц...

Red7
() автор топика
Ответ на: комментарий от Red7

Ну это одна страница. Я говорю о том, что всё работает, по ссылкам скачивается, никаких особых подвохов нет, кроме того, как этот форум наговнокодили и там запросы одной страницы по 15 секунд.

crutch_master ★★★★★
()
Последнее исправление: crutch_master (всего исправлений: 1)
Ответ на: комментарий от crutch_master

Хорошо, как скажете, парсить так парсить :)
Хотя разве wget или httrack не парсят? Если нет, то что же они делают?

Red7
() автор топика
Ответ на: комментарий от Red7

Это js-форум. Пишите свой парсер под него.

Deleted
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.