LINUX.ORG.RU
ФорумAdmin

мониторинг для очень большого количества серверов

 ,


0

2

Чем можно мониторить очень большое количество серверов, порядка 10к, но может быть и 50к?

Специфика в том, что они могут только посылать данные во внешний мир по https/443, то есть это «пассивные чеки» в терминах Nagios.

Нужно мониторить такие банальные вещи, как загрузку памяти/проца/диска/живость диска/наличие ключевых процессов, итого около 10 чеков на сервер.

Nagios - умеет быть хорошо scalable в режиме активных чеков, а в режиме пассивных? Если там будет прилетать около 200 чеков в секунду? Там они все кладутся в pipe nagios.cmd, ему не станет плохо?

ELK - больше про метрики, чем про чеки.

Zabbix - ??

Sensu - ??

★★★★★

Я бы смотрел или на Zabbix или на Prometheus.

Потому, что commmunity довольно широко. Продукты поддерживаются. Кластеризация присутствует. Документация тоже.

Много информации с конференций. И сами являются организаторами.

https://www.zabbix.com/events/zabbix_summit_2019

https://promcon.io/2019-munich/

При том, мне кажется - сможет ли принимать кол-во нужных item-ов, зависит по большей части от железа на то потраченое.

Потому, без видения хар-к железа - не могу сказать, что лучше. Но свои предпочтения озвучил.

i3wm
()

Был опыт внедрения и эксплуатации zabbix на 13к разношерстных машин по разношерстным протоколам. Могу сказать одно - это жопоболь примерно по всем параметрам, выбери что-нибудь другое.

phoen ★★
()
Ответ на: комментарий от anonymous

так чем ненравится nagios ? скорее станет плохо забиксу чем нагиусу

тем что там рано или поздно, после всех scaled/distributed штук, все сводится к одному пайпу Nagios.cmd на 1 сервере. Которому , вероятно, станет плохо от стольких чеков.

У меня был опыт с Nagios+mod_gearman на 6к серверах , 20 чеков на каждом. Все было отлично! Но там были АКТИВНЫЕ чеки , а на пассивных может стать плохо.

Bers666 ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.