LINUX.ORG.RU
ФорумAdmin

Посоветуйте систему мониторинга

 , , opennms, ,


1

3

Всем здравствуйте.

Посоветуйте, пожалуйста, систему мониторинга, соответствующую след. набору критериев:

  1. Наличие пакетов под Debian. Собирать вручную и самостоятельно поддерживать уже надоело.
  2. Распределённая архитектура (с возможностью либо устанавливать на наблюдаемую машину агента, либо, лучше, заходить по SSH по ключу и захватывать вывод произвольной команды). Ибо хочу наблюдать 4 машины и консолидировать данные.
  3. Хранение истории метрик (желательно, в базе – MySQL или PostgreSQL).
  4. Наличие Web-интерфейса для наблюдения метрик.
  5. Наличие Web-интерфейса для настройки (это то, чего лишены Nagios и Icinga).
  6. Умение мониторить SMART-атрибуты дисков без ужимок, прыжков, необходимости запускать процесс от имени root и вручную описывать наблюдаемую сущность. Вот это ключевое, потому что XXI век на дворе, а я только что убил полчаса на настройку /usr/lib/nagios/plugins/check_ide_smart – и ловлю себя на мысли, что проще с нуля приготовить MRTG, чем иметь дело с костылями под названием Nagios и его форками.

У кого есть опыт работы с OpenNMS, Zabbix, MRTG, PRTG, Cacti – да хоть чёртом в ступе – поделитесь, пожалуйста.

★★★★★

Последнее исправление: Bass (всего исправлений: 1)

У кого есть опыт работы с OpenNMS, Zabbix – да хоть чёртом в ступе – поделитесь, пожалуйста.

чем поделиться, чертом в ступе? zabbix под твои требования подходит, как и 99% всех систем мониторинга

colok
()
Ответ на: комментарий от colok

Меня интересовал личный опыт.

Потому что, формально, Nagios & friends под мои требования тоже подходят. Но на деле возникают нехилые такие нюансы.

Bass ★★★★★
() автор топика
Ответ на: комментарий от colok

мониторить SMART-атрибуты дисков без ужимок, прыжков, необходимости запускать процесс от имени root

как ты себе это представляешь?

colok
()

Умение мониторить SMART-атрибуты дисков без ужимок, прыжков, необходимости запускать процесс от имени root и вручную описывать наблюдаемую сущность.

А это смысл имеет? По идее, из raid выскочит диск и всё. Raid тебе скажет, что оно умерло и надо поменять.

DALDON ★★★★★
()
Ответ на: комментарий от colok

Например, минимальный suid-бинарь, который

  1. принимает на вход только имя устройства,
  2. умеет исполнять только smartctl и только с фиксированными аргументами (напр., -a или -x).

Это, согласись, несложно.

Т. е. я бы хотел, чтобы система мониторинга избавила бы меня от необходимости:

  1. указывать, что запускать и с какими ключами, и
  2. вручную править /etc/sudoers.
Bass ★★★★★
() автор топика
Ответ на: комментарий от DALDON

Имеет.

У меня же не ынтырпрайз-стойка, а несколько домашних машин. И далеко не всё в них продублировано (и далеко не всё имеет смысл дублировать). Например, если подохнет SSH-сервер – то я тупо куплю новый диск и поставлю на него новую систему.

Но вот оповещение о том, что «диск начал дохнуть», я хотел бы видеть в общей информационной сводке, без необходимости лазить на каждую машину и вручную запускать smartctl.

Bass ★★★★★
() автор топика
Ответ на: комментарий от Bass

принимает на вход только имя устройства
только с фиксированными аргументами

по бинарю на каждую опцию smartctl? ты хочешь какую-то херню, выбор опций smartctl и способа доступа нерутового юзера к рутовым устройствам — это совершенно точно не те настройки, которые надо выпиливать из системы мониторинга

colok
()
Ответ на: комментарий от Bass

Моя практика показывает что smart довольно бесполезен в деле реального положения здоровья диска. Ну это так, к слову.

DALDON ★★★★★
()

Посмотри на Prometheus, родной node_exporter smart-атрибуты не экспортирует, но в интернетах есть варианты от васянов на выбор, да и свой собственный можно тривиально сделать.

Singularity ★★★★★
()
Ответ на: комментарий от colok

Ты не понял. Пусть список фактических ключей smartctl будет зашит в suid-ном бинаре. Пусть это будет -a. Или -x. Мне всё равно. Но пусть это работает из коробки.

Собственно, в nagios так и попытались сделать — см. пресловутый check_ide_smart. Только авторы остановились в 1996 году и думают, что nagios всегда будет работать от рута. А без рута данный их бинарь бесполезен.

Bass ★★★★★
() автор топика
Ответ на: комментарий от DALDON

50 на 50.

Иногда дохнет контроллер, и да — smart бесполезен.

Но раз пять в моей практике я наблюдал именно появление uncorrectable-секторов и успевал заменить диск без переустановки или восстановления из бэкапов.

Кроме того, ты, по меньшей мере, можешь мониторить температуру, а это уже кое-что.

Bass ★★★★★
() автор топика
Ответ на: комментарий от Bass

вручную править /etc/sudoers.

Заранее сформированный файл раскидываете по /etc/sudoers.d/ на серверах, не трогайте основной

Т. е. я бы хотел, чтобы система мониторинга избавила бы меня от необходимости: указывать, что запускать и с какими ключами

Это же волшебство! Для заббикса добавляется конфигурация в zabbix_agent, а на сервере добавляется шаблон, обрабатывающий ту кастомную конфигурацию.

keir ★★
()
Ответ на: комментарий от Bass

Но на деле возникают нехилые такие нюансы.

Ну на практике только один раз.

turtle_bazon ★★★★★
()
Ответ на: комментарий от DALDON

Моя практика показывает что smart довольно бесполезен в деле реального положения здоровья диска. Ну это так, к слову.

ПС: поменял более 100 дисков.

turtle_bazon ★★★★★
()

На 4 машины что угодно по вкусу - я бы взял заббикс. Это не задача.

pekmop1024 ★★★★★
()

Наличие Web-интерфейса для настройки

У исинги есть такой интерфейс. Ставится дополнительно.
Prtg - безклиентное и небезопасное г.
По теме: icinga

dada ★★★★★
()

openITCOCKPIT

  1. Наличие пакетов под Debian. Собирать вручную и самостоятельно поддерживать уже надоело.

Пакеты для Debian и Ubuntu

Download openITCOCKPIT

  1. Распределённая архитектура (с возможностью либо устанавливать на наблюдаемую машину агента, либо, лучше, заходить по SSH по ключу и захватывать вывод произвольной команды). Ибо хочу наблюдать 4 машины и консолидировать данные.

Собственный агент для Linux, Windows и macOS

  1. Хранение истории метрик (желательно, в базе – MySQL или PostgreSQL).

MySQL/Graphite

  1. Наличие Web-интерфейса для наблюдения метрик.

Есть

  1. Наличие Web-интерфейса для настройки (это то, чего лишены Nagios и Icinga).

Также имеется

Демо

Попробуйте, может быть, понравится ;)

ira_1337
()
Ответ на: комментарий от dada

У исинги есть такой интерфейс. Ставится дополнительно.

Речь об icingaweb?

Он позволяет изменить список сервисов или вручную задать новые команды?

Bass ★★★★★
() автор топика
Ответ на: комментарий от DALDON

Люто плюсую! Тоже не заметил проку от этого инструмента.

alex_sim ★★★★
()

observium для малых ооо до 50 компов инстал и сопровождение для уровня 5 класса но работает стабильно бесплатен поддерживается работает по snmp wmi nmap мибы по дефолту распознают по сути любое железо от цисок компов принтеров и прочих ит-штук увы тажелый веб-дизайн - удаленно не пролезет через такую штуку как ngrok

nutbars
()

1-3, 5. Zabbix

4. Grafana + https://grafana.com/grafana/plugins/alexanderzobnin-zabbix-app

6. Сервер или агент так и так должны работать от рута, чтобы тыкать ioctl. А так в zabbix вроде есть шаблоны для smart.

Если Grafana будет работать не на x86_64, то я примерно так развлекался с установкой.

Ещё есть monitorix https://www.monitorix.org/

Пакеты тут https://www.monitorix.org/downloads.html

Но это чисто на графики пыриться. Свои плагины я писать не пробовал.

Radjah ★★★★★
()

Под требования вроде больше всего zabbix подходит.

Для своей лайбы использую grafana + prometheus + node_exporter - все отлично мониторит и красиво рисует. Smartctl не мониторю.

На работе ещё есть grafana + influxdb + telegraf. Тоже отлично всё работает.

skyman ★★★
()
Ответ на: комментарий от Radjah
  1. Да, но количество suid-кода можно (и нужно) свести к минимуму.

Спасибо!

Bass ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.