LINUX.ORG.RU

История изменений

Исправление lesopilorama, (текущая версия) :

Про watchdog: понятно, что это не тыкание сайта, а более сложно: тыкнуть надо несколько НАДЁЖНЫХ ip-адресов просто пингом. Решение о перезапуске сети делается по недоступности ВСЕХ этих адресов. Перезапускать сеть даже если недоступно стало 99% этих адресов, а отвечает только один - тоже странно, поскольку это всё ещё означает, что интернет есть и он нормален, у меня ведь на оконечном клиентском девайсе нет никаких хитрых таблиц маршрутизации. Хотя, возможно изменился дефолтный гейтвей, а старый видит только этот один айпишник и скоро его вообще погасят. В общем, да, наверное осмысленно начинать перезапускать сеть, когда пропало, скажем, 70% от списка айпишников.

Итого скрипт примерно такой:

  1. Пингануть по очереди все айпишники, послав штуки 4 запроса в каждый. Все ответы складывать в файлик специального своего формата. На каждый айпишник - секунды 4 времени. Что за айпишники: DNS-ы гугла, яндекса, какие-то стабильные серваки mail.ru и прочих корпораций, айпишники больших новостных сайтов. Этот список надо держать актуальным, возможно периодически загружать в рамдиск с какого-то внешнего управляющего центрального сервака.

  2. После обхода списка, запускается скрипт-анализатор, который читает вышесформированный отчёт (на формирование которого могла уйти минута), делает выводы о проценте недоступности и принимает решения.

  3. Слип 2 минуты и всё по-новой.

Не очевидно как вести себя с DNS. Возможно надо иметь в /etc/resolv.conf просто штук 5 разных адресов: пару популярных гугловых, пару яндексовых, что-то ещё. Возможно этого гарантированно навсегда хватит. Пинг не должен пинговать по доменным именам, поскольку таким образом он может споткнуться о недоступность DNS в целом (незнаю по какой причине) и таким образом неудачно пингануть ничего вообще. Хотя наверное это и правильно - если ты пинуту пинговал разные доменные адреса и у тебя всё зафейлилось, то точно стоит пнуть сеть целиком…

Исходная версия lesopilorama, :

Про watchdog: понятно, что это не тыкание сайта, а более сложно: тыкнуть надо несколько НАДЁЖНЫХ ip-адресов просто пингом. Решение о перезапуске сети делается по недоступности ВСЕХ этих адресов. Перезапускать сеть даже если недоступно стало 99% этих адресов, а отвечает только один - тоже странно, поскольку это всё ещё означает, что интернет есть и он нормален, у меня ведь на оконечном клиентском девайсе нет никаких хитрых таблиц маршрутизации. Хотя, возможно изменился дефолтный гейтвей, а старый видит только этот один айпишник и скоро его вообще погасят. В общем, да, наверное осмысленно начинать перезапускать сеть, когда пропало, скажем, 70% от списка айпишников.

Итого скрипт примерно такой:

  1. Пингануть по очереди все айпишники, послав штуки 4 запроса в каждый. Все ответы складывать в файлик специального своего формата. На каждый айпишник - секунды 4 времени.

  2. После обхода списка, запускается скрипт-анализатор, который читает вышесформированный отчёт (на формирование которого могла уйти минута), делает выводы о проценте недоступности и принимает решения.

  3. Слип 2 минуты и всё по-новой.