LINUX.ORG.RU
ФорумAdmin

Посоветуйте систему мониторинга для небольшой сети

 ,


3

4

Привет, ЛОР.

Мне нужна система для мониторинга в небольшой сети (до 20 машин).

Требования такие:

  • Оно должно быть свободным и бесплатным;
  • Не zabbix и не nagios (с ними я уже работал, они по-своему прекрасны, но я хочу поковырять что-нибудь новое);
  • Информация должна собираться по snmp;
  • Красивые графики;
  • Оперативные уведомления по почте и sms;
  • Не обязательно, чтобы предыдущие два пункта делала одна и та же система;
  • Оно имеет право жрать память как не в себя с тысячами метрик, но не имеет права требовать гигабайты оперативки для мониторинга 20 машин с парой десятков метрик на каждую;
  • Относительно простое конфигурирование, какие-нибудь группы или шаблоны с наследованием параметров, а еще лучше автоматический поиск и добавление хотя бы в зачаточном состоянии, чтобы я не стал поехавшим после настройки всего этого хозяйства.

Пока смотрю варианты из этого списка, но процесс идет не быстро. На что стоит в первую очередь обратить внимание, а на что не стоит вообще тратить время?

Deleted

Красивые графики;

а на что не стоит вообще тратить время?

Тогда munin не советую. Не знаю на счет остальных пунктов (вообще там модули очень просто пишутся, snmp он умеет, так что вопрос про sms из коробки), но красивых графиков из него не получишь (хотя я бы не сказал что и zabbix может рисовать удобные графики). С другой стороны он жрет практически ничего и конфигурируется просто, так что если нужна информация вида «с часу до двух тот хост лежал» (вместо «упал в 13:01:44, поднялся в 13:58:07») то на него стоит посмотреть.

alozovskoy ★★★★★ ()

но я хочу поковырять что-нибудь новое

Если не пугает виндовое решение посмотри на dude, я сначала плевался на него, но оказалось нормальная система. Которая всеравно постепенно заменяется zabbix'ом.

Ну и cacti, nocproject по своему интересны.

Deleted ()
Ответ на: комментарий от alozovskoy

если нужна информация вида «с часу до двух тот хост лежал» (вместо «упал в 13:01:44, поднялся в 13:58:07») то на него стоит посмотреть

Скорее нужны графики, наглядно демонстрирующие корреляции между компилянием генты и температурой в комнате, или скачками напряжения в розетке и самочувствием провайдерского роутера и т.п.

Deleted ()
Последнее исправление: somestuff (всего исправлений: 1)
Ответ на: комментарий от Deleted

Если не пугает виндовое решение посмотри на dude, я сначала плевался на него, но оказалось нормальная система.

У меня нет винды.

Deleted ()
Ответ на: комментарий от Deleted

Тогда в любом случае придется велосипедить. Тут дело в периоде сбора информации просто, у munin это емнип раз в 5 минут, если меньше то графики ломаются.

alozovskoy ★★★★★ ()

AggreGate Network Manager

Не свободная, но посмотреть стоит.

Deathstalker ★★★★★ ()
Ответ на: комментарий от Difrex

+uchiwa

Плюсую. На 5-10 машин это прекрасное решение.

На ~20 тоже подойдет. Правда поднятие и настройка для некоторых может показаться нетривиальной.

trofk ★★★ ()
Последнее исправление: trofk (всего исправлений: 1)

Check_MK, хоть и нагиосный плагин (и оный в ядре, можно попробовать заменить на icinga, выбор через менюшку), но очень годный. Мониторит у меня 150 машин на работе, и примерно столько же сетевых железок на виртуалке с 4GB RAM.

Для легкой установки используй OMD (omdistro.org).

Умеет по почте, по СМС - если настроишь, графики красивые, свободное и бесплатное, дома для мониторинга 25 машинок (виртуалки и физические сервера) жрет порядка 500мбайт (максимум - до 800мбайт), умеет автодискавери чекеров по SNMP.

Что точно не посоветую - zenoss и прочие zabbix-производные. Они унылы после Check_mk.

pztrn ★★★★ ()
Ответ на: комментарий от trofk

На 5-10 машин это прекрасное решение.

Оно и на 300 машин прекрасное решение =) Главное хандлеры, плагины и чеки нужные написать

Самое главное, что такая связка масштабируется, как угодно

Difrex ★★★★ ()
Последнее исправление: Difrex (всего исправлений: 1)
Ответ на: комментарий от Difrex

Много напильником дорабатывали?

Что входило в обработку напильником?

Расскажи про архитектуру на 300 клиентских машин. RabbitMQ один или в кластере? Сколько проверок выполняется на клиентах и с какой периодичностью? Сколько времени потратили на написание handlers/plugins/checks, брали ли готовые?

trofk ★★★ ()

Пока смотрю варианты из этого списка,

Что-то xymon отсутствует в этом списке. А что значит «красивые графики» ?

AS ★★★★★ ()
Ответ на: комментарий от AS

Скорее всего это значит «не такие как в заббиксе»

trofk ★★★ ()

munin - дёшево и сердито. По почте уведомит, для sms внешний сервис потребуется.

tiandrey ★★★★★ ()
Ответ на: комментарий от trofk

Много напильником дорабатывали?

Не много. Все почти работает из коробки

Что входило в обработку напильником?

Много чего опакетить надо было.

Расскажи про архитектуру на 300 клиентских машин. RabbitMQ один или в кластере? Сколько проверок выполняется на клиентах и с какой периодичностью?

Рэббит у нас используется не только для сенсу. Он в кластере. Постгресс для grafana/graphite, и.т.д тоже в кластере. Вместо питонового карбона использую go-carbon. В учиву/графану смотрят не только админы, но и разрабы. Т.е. у них есть права на гашение чеков. Т.к., например, они любят сами зажигать свои.

Сколько времени потратили на написание handlers/plugins/checks, брали ли готовые?

Многие базовые чеки взяты из sensu-community-plugins. При наливке нового сервера он автоматически(ansible) подписывается на base, где все базовые чеки. Так же когда ставишь, например, mariadb, то приезжает подписка mariadb, и.т.д.

Больше всего времени потратил на написание мыло/джаббер хадлеров и чеков/метрик кокаина.

Difrex ★★★★ ()
Ответ на: комментарий от Difrex

А дай мне скрин учивы и графаны, если там нет корп. тайны. Хочу посмотреть.

trofk ★★★ ()
Ответ на: комментарий от trofk

Графана чуть ниже, учиву смысла не вижу показывать. Она сейчас вся зеленая. :)

Difrex ★★★★ ()
Ответ на: комментарий от Difrex

Графана и у меня есть настроенная. Но смотрит пока в заббикс. А сенсу пока не в продакшене

trofk ★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.