Сохранение страниц проходящих через squid

squid html

1

1

Добрый день!

Есть необходимость сохранять html страницы с определенного сайта из трафика проходящего через squid в отдельную папку. Интересует только html без картинок, css и прочего. Подскажите, пожалуйста, как лучше это реализовать: можно ли это сделать с помощью squid и его extensions или следует использовать какие то другие средства?

Спасибо!

Ссылка

←	nginx+php-fpm -> 404

TRIM в гостевых системах под управлением libvirt/qemu-kvm

→

Именно squid, wwwoffle не пройдёт?

sin_a ★★★★★
(16.09.13 16:43:21 MSK)

Ответ на: комментарий от sin_a 16.09.13 16:43:21 MSK

Не хотелось бы ставить еще одну проксю рядом...

cbl
(16.09.13 16:50:35 MSK) автор топика

Ответ на: комментарий от cbl 16.09.13 16:50:35 MSK

Если это твой домашний прокси на одного человека, то этот может больше подойти. А так — можно и с помощью wget забирать периодически.

sin_a ★★★★★
(16.09.13 17:10:16 MSK)

Ответ на: комментарий от sin_a 16.09.13 17:10:16 MSK

К сожалению, это корпоративный прокси на 100+ пользователей с авторизацией, и сайт дергать wget не получится, так как: 1. на сайте есть авторизация; 2. нужно сохранить не просто сайт, а именно страницы посещенные нашими пользователями.

cbl
(16.09.13 17:18:05 MSK) автор топика

Ответ на: комментарий от cbl 16.09.13 17:18:05 MSK

Тогда искать просмотрщики кэша сквида, вроде такие бывают.

sin_a ★★★★★
(16.09.13 17:22:39 MSK)

Ответ на: комментарий от sin_a 16.09.13 17:22:39 MSK

А странички динамические? если да, то они в кэше не осядут. тут может просто снифить сеть и записывать и парсить трафик к этому сайту надо?

victorb ★★
(16.09.13 18:22:39 MSK)

Ответ на: комментарий от victorb 16.09.13 18:22:39 MSK

Странички динамические, по GET запросам типа index.php?param1=xxx&param2=yyy и мне необходимо именно соотношение запроса к html. GET же вроде должен хорошо кешироваться по логике или я ошибаюсь?

cbl
(16.09.13 18:54:27 MSK) автор топика