В розыске софт для мониторинга

0

1

Привет, житель ЛОРа. Посоветуй систему мониторинга. Требования:

Легковесность.
Мониторинг HTTP и состояния процессов. Если можно указывать свои скрипты как в Munin, то прекрасно.
Уведомления. Нужна возможность запускать свой скрипт (sendxmpp).
Кроссплатформенность (Linux, Windows).

Графики мне не нужны. Monit почти подходит по требованиям, но у него проблемы с sendxmpp и кроссплатформенностью. Munin тоже почти устраивает, но у него нереально изменить интервал обновления и не хочется каждые 5 минут опрашивать все машины — мне нужны только уведомления о проблемах, постоянный мониторинг не требуется. Zabbix и Nagios вроде сильно жирные.
Что еще есть?

Ссылка

← Screen

Перенос ситемы на другой жесткий ситемы →

Попробую collectd.

Black_Roland ★★★★
(26.09.14 07:28:28 MSK) автор топика

Ссылка

мне нужны только уведомления о проблемах

nagios

~~Amet13~~ ★★★★★
(26.09.14 07:43:45 MSK)

В Munin интервал можно изменить, он же по крону запускается.

alozovskoy ★★★★★
(26.09.14 07:48:07 MSK)

Ответ на: комментарий от alozovskoy 26.09.14 07:48:07 MSK

График «рваный» получается.

Black_Roland ★★★★
(26.09.14 08:00:35 MSK) автор топика

Ссылка

Ответ на: комментарий от Amet13 26.09.14 07:43:45 MSK

nagios

А как оно по жирносте и простоте настройки?

Black_Roland ★★★★
(26.09.14 08:01:05 MSK) автор топика

я использую icinga (форк нагиоса)

dada ★★★★★
(26.09.14 08:45:51 MSK)

Ссылка

не хочется каждые 5 минут опрашивать все машины — мне нужны только уведомления о проблемах

Хитрый план. Надо исходить из среднего времени*2, через которое ты хочешь узнать о проблеме (не считая задержки уведомления).

Monit почти подходит по требованиям

опенсорсный же standalone, клиент-сервер вроде платный и закрытый. А со standalone, если машина потеряет сеть или повиснет/выключится, то узнаешь об этом поздно

disarmer ★★★
(26.09.14 09:19:20 MSK)

Ссылка

Ты знаешь, я накатил давича zabbix 2.2 LTS, вполне себе простой, удобный, и не сказать чтобы он прям все мои ресурсы сожрал... Зато там есть много фишек: типа массового заведения без погружения в конфиг файлы.

DALDON ★★★★★
(26.09.14 09:25:56 MSK)

Ответ на: комментарий от DALDON 26.09.14 09:25:56 MSK

Тут в похожих тред есть: Очередной тред выбора системы мониторинга Что-то Zabbix меня теперь смущает. Плюс по работе есть сервак с заббиксом, так вот агент сжирает место на диске, пока его не перезапустишь.

Black_Roland ★★★★
(26.09.14 09:57:55 MSK) автор топика

Ссылка

mrtg

Igron ★★★★★
(26.09.14 10:05:26 MSK)

Ответ на: комментарий от DALDON 26.09.14 09:25:56 MSK

zabbix 2.2 LTS, вполне себе простой, удобный

Ну, zabbix называть простым и удобным это как-то странно. Его плюшки начинаются, когда хостов десятки.

Igron ★★★★★
(26.09.14 10:07:15 MSK)

вот, кстати, реально не хватает чего-то простого и straight-forward. Nagios мне никогда не нравился, Zabbix жирный, munin не очень удобен.

Alsvartr ★★★★★
(26.09.14 10:50:31 MSK)

Ответ на: комментарий от Igron 26.09.14 10:05:26 MSK

ну mrtg - это несколько другое. К тому же, если нужны графики, snmp-мониторинг и вот это всё, то лучше уж cacti. Он хоть и настраивается через зад, но поудобней и пофичастей.

Alsvartr ★★★★★
(26.09.14 10:52:11 MSK)

Ссылка

Лучше всего имхо nagios. Мало того, что он следит, может графики рисовать и сам поднимать все сервисы.

Еще ни раз он спасал, когда место на хардах кончалось.

fjfalcon ★★★
(26.09.14 10:52:26 MSK)

Ответ на: комментарий от fjfalcon 26.09.14 10:52:26 MSK

Еще ни раз он спасал, когда место на хардах кончалось.

ты про notifications ?

dada ★★★★★
(26.09.14 11:04:35 MSK)

Ответ на: комментарий от dada 26.09.14 11:04:35 MSK

Да.

fjfalcon ★★★
(26.09.14 11:47:54 MSK)

Ссылка

Ответ на: комментарий от Igron 26.09.14 10:07:15 MSK

Да я натыркал базовый мониторинг с zabbix агента, вообще не напрягась. Ну и на ping поставил десятки машин - одним движением мышки... В общем, то что - одна, что много, разницы нету. Но я пока ничего сложного не делал. Просто смотрю. Но уже ценные отчёты получаю.

DALDON ★★★★★
(26.09.14 13:02:46 MSK)

Ответ на: комментарий от Black_Roland 26.09.14 08:01:05 MSK

По жирности - 0.

В простоте настройки - тоже, свои плагины писать очень просто.

~~Amet13~~ ★★★★★
(26.09.14 13:55:02 MSK)

Ссылка

xymon

Легковесность.

В распределённой конфигурации мониторил ~ 1.5k хостов легко. В другой компании ~ 1к хостов повесили на один сервер. Там нагрузка на сервер была выше, но справлялся.

Мониторинг HTTP и состояния процессов. Если можно указывать свои скрипты как в Munin, то прекрасно.

всё есть

Уведомления. Нужна возможность запускать свой скрипт (sendxmpp).

Штатно работать с xmpp не умеет. Если у тебя есть скрипт, то он легко подключается

man alerts.cfg

       SCRIPT /path/to/script recipientID Recipient  that  invokes  a  script.
       This  takes two parameters: The script filename, and the recipient that
       gets passed to the  script.   The  strings  "&host&",  "&service&"  and
       "&color&"  in  the recipientID will be replaced with the hostname, ser-
       vice and color of the alert, respectively.

Кроссплатформенность (Linux, Windows).

Клиенты на любой ОСи работают. Сервер ставил только на linux, нужно свериться с документацией

Графики мне не нужны

Они есть. Новые добавляются не слишком просто, но добавляются.

Munin тоже почти устраивает, но у него нереально изменить интервал обновления и не хочется каждые 5 минут опрашивать все машины — мне нужны только уведомления о проблемах, постоянный мониторинг не требуется.

По умолчанию клиент раз в 5 минут шлёт данные на сервер. Интервал можно менять, но графики ( из rrd ) заточены под 5 минутные интервалы. Если клиент не прилал данные в течение 30 минут, считается что он совсем помер, и это тоже отражается как проблема.

Опрос со стороны сервера xymon ( http(s), dns, ping, ssh, pop3(s), imap(s) и т.д. ) по умолчанию тоже раз в 5 минут, меняется в tasks.cfg. Все интервалы настраиваются.

Если появятся вопросы, спрашивай.

З.Ы. zabbix не советую, намучаешься. Возможностей у него больше, геморроя - на порядок больше

З.З.Ы. по умолчанию конфигурируется всё на стороне сервера. Клиент шлёт список процессов, заполненность дисков, использование памяти и т.д., а сервер интерпретирует их в соответствии со своим конфигом.

Клиент можно перевести в режим локальной конфигурации, после этого объекты мониторинга будут браться из конфига клиента, а на сервер отправляться только результаты.

router ★★★★★
(26.09.14 14:15:38 MSK)
Последнее исправление: router 26.09.14 14:24:46 MSK (всего исправлений: 1)

Ответ на: комментарий от DALDON 26.09.14 13:02:46 MSK

1. Если внести изменение в триггер шаблона, отразится ли это изменение на хостах, привязанных к шаблону? У меня zabbix создавал новый триггер, или не делал вообще ничего.

2. Как задать разный порог мониторинга для дисков /, /opt и /oradata при использовании low level autodiscovery ?

router ★★★★★
(26.09.14 14:17:47 MSK)

Ответ на: комментарий от router 26.09.14 14:15:38 MSK

Xymon

https://upload.wikimedia.org/wikipedia/commons/thumb/0/0c/Xymon.png/1280px-Xy...

что это за жесть?

Alsvartr ★★★★★
(26.09.14 14:29:35 MSK)

Ответ на: комментарий от Alsvartr 26.09.14 14:29:35 MSK

На скриншоте страница «All non-green view», т.е. список всех хостов, у которых обнаружены ошибки. в данном случае в списке один хост, ошибка связана с raid контроллером. Подробности открываются после клика мышкой по красной лампе. Ниже список последних событий ( изменений статуса триггеров )

На странице «all non-green view» отражаются не все лампы ( триггеры ), а только те, а только те, которые с ошибкой. + две стандартные info ( информация по хосту, в частности - страница, на которой он расположен, список ламп, ip адрес, комментарий, запланированные даунтаймы и т.д. ) и trends ( все графики, связанные с хостом ). Если б у другого хоста был переполнен диск, было бы четыре колонки - disk, info, raid, trends. Полностью зелёные столбцы не отражаются ( кроме уже упомянутых info и trends )

З.Ы. xymon online demo

router ★★★★★
(26.09.14 16:23:12 MSK)
Последнее исправление: router 26.09.14 16:24:08 MSK (всего исправлений: 1)