LINUX.ORG.RU
ФорумAdmin

Посоветуйте систему мониторинга

 , , , ,


1

3

Всем здравствуйте.

Посоветуйте, пожалуйста, систему мониторинга, соответствующую след. набору критериев:

  1. Наличие пакетов под Debian. Собирать вручную и самостоятельно поддерживать уже надоело.
  2. Распределённая архитектура (с возможностью либо устанавливать на наблюдаемую машину агента, либо, лучше, заходить по SSH по ключу и захватывать вывод произвольной команды). Ибо хочу наблюдать 4 машины и консолидировать данные.
  3. Хранение истории метрик (желательно, в базе – MySQL или PostgreSQL).
  4. Наличие Web-интерфейса для наблюдения метрик.
  5. Наличие Web-интерфейса для настройки (это то, чего лишены Nagios и Icinga).
  6. Умение мониторить SMART-атрибуты дисков без ужимок, прыжков, необходимости запускать процесс от имени root и вручную описывать наблюдаемую сущность. Вот это ключевое, потому что XXI век на дворе, а я только что убил полчаса на настройку /usr/lib/nagios/plugins/check_ide_smart – и ловлю себя на мысли, что проще с нуля приготовить MRTG, чем иметь дело с костылями под названием Nagios и его форками.

У кого есть опыт работы с OpenNMS, Zabbix, MRTG, PRTG, Cacti – да хоть чёртом в ступе – поделитесь, пожалуйста.

★★★★★

Умение мониторить SMART-атрибуты дисков без ужимок, прыжков, необходимости запускать процесс от имени root и вручную описывать наблюдаемую сущность.

А это смысл имеет? По идее, из raid выскочит диск и всё. Raid тебе скажет, что оно умерло и надо поменять.

DALDON ★★★★★ ()
Ответ на: комментарий от colok

Например, минимальный suid-бинарь, который

  1. принимает на вход только имя устройства,
  2. умеет исполнять только smartctl и только с фиксированными аргументами (напр., -a или -x).

Это, согласись, несложно.

Т. е. я бы хотел, чтобы система мониторинга избавила бы меня от необходимости:

  1. указывать, что запускать и с какими ключами, и
  2. вручную править /etc/sudoers.
Bass ★★★★★ ()
Ответ на: комментарий от DALDON

Имеет.

У меня же не ынтырпрайз-стойка, а несколько домашних машин. И далеко не всё в них продублировано (и далеко не всё имеет смысл дублировать). Например, если подохнет SSH-сервер – то я тупо куплю новый диск и поставлю на него новую систему.

Но вот оповещение о том, что «диск начал дохнуть», я хотел бы видеть в общей информационной сводке, без необходимости лазить на каждую машину и вручную запускать smartctl.

Bass ★★★★★ ()
Ответ на: комментарий от Bass

принимает на вход только имя устройства
только с фиксированными аргументами

по бинарю на каждую опцию smartctl? ты хочешь какую-то херню, выбор опций smartctl и способа доступа нерутового юзера к рутовым устройствам — это совершенно точно не те настройки, которые надо выпиливать из системы мониторинга

colok ()
Ответ на: комментарий от colok

Ты не понял. Пусть список фактических ключей smartctl будет зашит в suid-ном бинаре. Пусть это будет -a. Или -x. Мне всё равно. Но пусть это работает из коробки.

Собственно, в nagios так и попытались сделать — см. пресловутый check_ide_smart. Только авторы остановились в 1996 году и думают, что nagios всегда будет работать от рута. А без рута данный их бинарь бесполезен.

Bass ★★★★★ ()
Ответ на: комментарий от DALDON

50 на 50.

Иногда дохнет контроллер, и да — smart бесполезен.

Но раз пять в моей практике я наблюдал именно появление uncorrectable-секторов и успевал заменить диск без переустановки или восстановления из бэкапов.

Кроме того, ты, по меньшей мере, можешь мониторить температуру, а это уже кое-что.

Bass ★★★★★ ()
Ответ на: комментарий от Bass

вручную править /etc/sudoers.

Заранее сформированный файл раскидываете по /etc/sudoers.d/ на серверах, не трогайте основной

Т. е. я бы хотел, чтобы система мониторинга избавила бы меня от необходимости: указывать, что запускать и с какими ключами

Это же волшебство! Для заббикса добавляется конфигурация в zabbix_agent, а на сервере добавляется шаблон, обрабатывающий ту кастомную конфигурацию.

keir ★★ ()

openITCOCKPIT

  1. Наличие пакетов под Debian. Собирать вручную и самостоятельно поддерживать уже надоело.

Пакеты для Debian и Ubuntu

Download openITCOCKPIT

  1. Распределённая архитектура (с возможностью либо устанавливать на наблюдаемую машину агента, либо, лучше, заходить по SSH по ключу и захватывать вывод произвольной команды). Ибо хочу наблюдать 4 машины и консолидировать данные.

Собственный агент для Linux, Windows и macOS

  1. Хранение истории метрик (желательно, в базе – MySQL или PostgreSQL).

MySQL/Graphite

  1. Наличие Web-интерфейса для наблюдения метрик.

Есть

  1. Наличие Web-интерфейса для настройки (это то, чего лишены Nagios и Icinga).

Также имеется

Демо

Попробуйте, может быть, понравится ;)

ira_1337 ()

observium для малых ооо до 50 компов инстал и сопровождение для уровня 5 класса но работает стабильно бесплатен поддерживается работает по snmp wmi nmap мибы по дефолту распознают по сути любое железо от цисок компов принтеров и прочих ит-штук увы тажелый веб-дизайн - удаленно не пролезет через такую штуку как ngrok

nutbars ()

1-3, 5. Zabbix

4. Grafana + https://grafana.com/grafana/plugins/alexanderzobnin-zabbix-app

6. Сервер или агент так и так должны работать от рута, чтобы тыкать ioctl. А так в zabbix вроде есть шаблоны для smart.

Если Grafana будет работать не на x86_64, то я примерно так развлекался с установкой.

Ещё есть monitorix https://www.monitorix.org/

Пакеты тут https://www.monitorix.org/downloads.html

Но это чисто на графики пыриться. Свои плагины я писать не пробовал.

Radjah ★★★★★ ()

Под требования вроде больше всего zabbix подходит.

Для своей лайбы использую grafana + prometheus + node_exporter - все отлично мониторит и красиво рисует. Smartctl не мониторю.

На работе ещё есть grafana + influxdb + telegraf. Тоже отлично всё работает.

skyman ★★ ()