Чем можно мониторить очень большое количество серверов, порядка 10к, но может быть и 50к?
Специфика в том, что они могут только посылать данные во внешний мир по https/443, то есть это «пассивные чеки» в терминах Nagios.
Нужно мониторить такие банальные вещи, как загрузку памяти/проца/диска/живость диска/наличие ключевых процессов, итого около 10 чеков на сервер.
Nagios - умеет быть хорошо scalable в режиме активных чеков, а в режиме пассивных? Если там будет прилетать около 200 чеков в секунду? Там они все кладутся в pipe nagios.cmd, ему не станет плохо?
ELK - больше про метрики, чем про чеки.
Zabbix - ??
Sensu - ??