LINUX.ORG.RU
решено ФорумAdmin

В розыске софт для мониторинга

 , , , ,


0

1

Привет, житель ЛОРа. Посоветуй систему мониторинга. Требования:

  • Легковесность.
  • Мониторинг HTTP и состояния процессов. Если можно указывать свои скрипты как в Munin, то прекрасно.
  • Уведомления. Нужна возможность запускать свой скрипт (sendxmpp).
  • Кроссплатформенность (Linux, Windows).

Графики мне не нужны. Monit почти подходит по требованиям, но у него проблемы с sendxmpp и кроссплатформенностью. Munin тоже почти устраивает, но у него нереально изменить интервал обновления и не хочется каждые 5 минут опрашивать все машины — мне нужны только уведомления о проблемах, постоянный мониторинг не требуется. Zabbix и Nagios вроде сильно жирные.
Что еще есть?

я использую icinga (форк нагиоса)

dada ★★★★★ ()

не хочется каждые 5 минут опрашивать все машины — мне нужны только уведомления о проблемах

Хитрый план. Надо исходить из среднего времени*2, через которое ты хочешь узнать о проблеме (не считая задержки уведомления).

Monit почти подходит по требованиям

опенсорсный же standalone, клиент-сервер вроде платный и закрытый. А со standalone, если машина потеряет сеть или повиснет/выключится, то узнаешь об этом поздно

disarmer ★★★ ()

Ты знаешь, я накатил давича zabbix 2.2 LTS, вполне себе простой, удобный, и не сказать чтобы он прям все мои ресурсы сожрал... Зато там есть много фишек: типа массового заведения без погружения в конфиг файлы.

DALDON ★★★★★ ()
Ответ на: комментарий от DALDON

zabbix 2.2 LTS, вполне себе простой, удобный

Ну, zabbix называть простым и удобным это как-то странно. Его плюшки начинаются, когда хостов десятки.

Igron ★★★★★ ()

вот, кстати, реально не хватает чего-то простого и straight-forward. Nagios мне никогда не нравился, Zabbix жирный, munin не очень удобен.

Alsvartr ★★★★★ ()
Ответ на: комментарий от Igron

ну mrtg - это несколько другое. К тому же, если нужны графики, snmp-мониторинг и вот это всё, то лучше уж cacti. Он хоть и настраивается через зад, но поудобней и пофичастей.

Alsvartr ★★★★★ ()

Лучше всего имхо nagios. Мало того, что он следит, может графики рисовать и сам поднимать все сервисы.

Еще ни раз он спасал, когда место на хардах кончалось.

fjfalcon ★★★ ()
Ответ на: комментарий от Igron

Да я натыркал базовый мониторинг с zabbix агента, вообще не напрягась. Ну и на ping поставил десятки машин - одним движением мышки... В общем, то что - одна, что много, разницы нету. Но я пока ничего сложного не делал. Просто смотрю. Но уже ценные отчёты получаю.

DALDON ★★★★★ ()
Ответ на: комментарий от Black_Roland

По жирности - 0.

В простоте настройки - тоже, свои плагины писать очень просто.

Amet13 ★★★★★ ()

xymon

Легковесность.

В распределённой конфигурации мониторил ~ 1.5k хостов легко. В другой компании ~ 1к хостов повесили на один сервер. Там нагрузка на сервер была выше, но справлялся.

Мониторинг HTTP и состояния процессов. Если можно указывать свои скрипты как в Munin, то прекрасно.

всё есть

Уведомления. Нужна возможность запускать свой скрипт (sendxmpp).

Штатно работать с xmpp не умеет. Если у тебя есть скрипт, то он легко подключается

man alerts.cfg

       SCRIPT /path/to/script recipientID Recipient  that  invokes  a  script.
       This  takes two parameters: The script filename, and the recipient that
       gets passed to the  script.   The  strings  "&host&",  "&service&"  and
       "&color&"  in  the recipientID will be replaced with the hostname, ser-
       vice and color of the alert, respectively.

Кроссплатформенность (Linux, Windows).

Клиенты на любой ОСи работают. Сервер ставил только на linux, нужно свериться с документацией

Графики мне не нужны

Они есть. Новые добавляются не слишком просто, но добавляются.

Munin тоже почти устраивает, но у него нереально изменить интервал обновления и не хочется каждые 5 минут опрашивать все машины — мне нужны только уведомления о проблемах, постоянный мониторинг не требуется.

По умолчанию клиент раз в 5 минут шлёт данные на сервер. Интервал можно менять, но графики ( из rrd ) заточены под 5 минутные интервалы. Если клиент не прилал данные в течение 30 минут, считается что он совсем помер, и это тоже отражается как проблема.

Опрос со стороны сервера xymon ( http(s), dns, ping, ssh, pop3(s), imap(s) и т.д. ) по умолчанию тоже раз в 5 минут, меняется в tasks.cfg. Все интервалы настраиваются.

Если появятся вопросы, спрашивай.

З.Ы. zabbix не советую, намучаешься. Возможностей у него больше, геморроя - на порядок больше

З.З.Ы. по умолчанию конфигурируется всё на стороне сервера. Клиент шлёт список процессов, заполненность дисков, использование памяти и т.д., а сервер интерпретирует их в соответствии со своим конфигом.

Клиент можно перевести в режим локальной конфигурации, после этого объекты мониторинга будут браться из конфига клиента, а на сервер отправляться только результаты.

router ★★★★★ ()
Последнее исправление: router (всего исправлений: 1)
Ответ на: комментарий от DALDON

1. Если внести изменение в триггер шаблона, отразится ли это изменение на хостах, привязанных к шаблону? У меня zabbix создавал новый триггер, или не делал вообще ничего.

2. Как задать разный порог мониторинга для дисков /, /opt и /oradata при использовании low level autodiscovery ?

router ★★★★★ ()
Ответ на: комментарий от Alsvartr

На скриншоте страница «All non-green view», т.е. список всех хостов, у которых обнаружены ошибки. в данном случае в списке один хост, ошибка связана с raid контроллером. Подробности открываются после клика мышкой по красной лампе. Ниже список последних событий ( изменений статуса триггеров )

На странице «all non-green view» отражаются не все лампы ( триггеры ), а только те, а только те, которые с ошибкой. + две стандартные info ( информация по хосту, в частности - страница, на которой он расположен, список ламп, ip адрес, комментарий, запланированные даунтаймы и т.д. ) и trends ( все графики, связанные с хостом ). Если б у другого хоста был переполнен диск, было бы четыре колонки - disk, info, raid, trends. Полностью зелёные столбцы не отражаются ( кроме уже упомянутых info и trends )

З.Ы. xymon online demo

router ★★★★★ ()
Последнее исправление: router (всего исправлений: 1)
Ответ на: комментарий от router

Я боюсь Вы меня положили на лопатки. Ибо:

2. Как задать разный порог мониторинга для дисков /, /opt и /oradata при использовании low level autodiscovery ?.

Уже не тривиально. Ну в целом, для базовых вещей вроде годится.

DALDON ★★★★★ ()
Ответ на: комментарий от Alsvartr

играюсь с monitorix - милая штучка. а для красивых рисовалок и тупого snmp - observium

dyasny ★★★★★ ()

Nagios пока не могу осилить, cgi неправильно настроен. В общем спасибо за ответы, буду пробовать еще.

Black_Roland ★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.