LINUX.ORG.RU
ФорумAdmin

А подскажите на какую систему мониторинга посмотреть?

 ,


1

4

Устал от zabbix, я его довольно хорошо знаю, но просто устал, хочется чего-то нового! Мониторю в основном сетевые железки по snmp

С чем сталкивался:
nagios/icinga - как пинговалка прикольно, но не более
smokeping - еще более прикольная пинговалка, визуально показывает задержки и потери
netxms - не разобрался, но суть в том что если авторы добавили поддержку железки то будет неплохо мониторить из коробки, а как свои шаблоны (или драйвера в их терминологии) писать я не вдуплил
librenms - монстр какой-то, но он у меня выжирал всю память в попытках просканить 4 сотни коммутаторов и падал вместе с БД
prometheus - это что-то на языке devops, для snmp мониторинга надо конкретный КОД писать
dude - мониторилка mikrotik (хотя по snmp можно и другие железки опрашивать), нет сервера под linux. Использовал в одной конторе т.к. тех.диру нравился визуал

Что еще посмотреть? Естественно под linux и for free

★★★★★

Мониторю в основном сетевые железки по snmp

Тогда zabbix - хороший выбор

просто устал, хочется чего-то нового!

Все, что ты перечислил - вполне приличные системы мониторинга. Но без феи крестной в комплекте :) Хочешь, чтобы оно работало - надо садиться и разбираться

Ну можешь поставить grafana и подключить к zabbix. Даже если возможности графаны использовать не научишься, интерфейс удобнее и графики красивее :)

router ★★★★★
()
Ответ на: комментарий от router

Ну можешь поставить grafana и подключить к zabbix. Даже если возможности графаны использовать не научишься, интерфейс удобнее и графики красивее :)

Я с ней немного работал, но там был свой скрипт для парсинга netflow, то что от zabbix можно метрики брать знаю, но пока не было необходимости.

Kolins ★★★★★
() автор топика

Zenoss посмотри. Она хороша тем, что там нет агента, работает по ssh. Но если тебе snmp, то без разницы, с ним оно тоже работает.

Aceler ★★★★★
()
Ответ на: комментарий от aol

всё уже украдено написано до вас

Учитывая разброд и шатание в видении snmp у вендеров, этот код надо будет править под конкретные железки. А там еще и go. Ну может когда-нибудь дойду и до prometheus

Kolins ★★★★★
() автор топика

nagios/icinga - как пинговалка прикольно, но не более

с удовольствием мониторил около 2500+ железок в том числе и через SNMP

связка была

icinga(до этого nagios)

mk livestatus - позволял шарить состояние мониторинга через удобный API

gearmand - позволял горизонтально скейлить количество проверок, у меня доходило до 28к тысяч за 5 минут

thruk удобная web морда, которая работала через mk livestatus

nagiosgraph - автоматически строил графики для каждой цифры попадающий в performance_output проверок

единственный, но большой недостаток этого подхода был в том, что nagios(icinga) на архитектурном уровне не мог выполнять проверки чаще чем раз в минуту

gagarin0
()
Последнее исправление: gagarin0 (всего исправлений: 3)
Ответ на: комментарий от sparkie

По сабжу: заббикс.

Да понятно что мне от него уже никуда не деться. из-за универсальности. Надо что-то на сервере земониторить: наговнокодил скрипт который json возвращает, и дергаешь через агента, красота!

Kolins ★★★★★
() автор топика

Ну очевидно лучшая и самая классная netdata.

Мне думается, что ничего лучше netdata, нету в 2025м. У netdata были проблемы, что до какого-то времени это был только мониторинг в реальном времени, но с cloud решением это решено из коробки, без необходимости связывания netdata, например с той же Grafana (я в свое время использовал связку netdata, InfluxDB, Grafana, когда netdata cloud еще не существовало)

anonymous_sama ★★★★★
()

я его довольно хорошо знаю, но просто устал, хочется чего-то нового

С такой постановкой вопроса так и хочется посоветовать: напиши свою! Приток новизны и адреналина гарантирован, а может, и ещё кому пригодится. :)

hobbit ★★★★★
()
Ответ на: комментарий от irton

Да, вас ждет еще много открытий чудных

директорат любуется на графики.

«графики» это прошлый век

А подскажите на какую систему мониторинга посмотреть? (комментарий)

репозиторий на гитхабе https://github.com/metacoma/minetest-tcpdump-demo

gagarin0
()
Последнее исправление: gagarin0 (всего исправлений: 2)

librenms - монстр какой-то, но он у меня выжирал всю память в попытках просканить 4 сотни коммутаторов и падал вместе с БД

Ну у меня там поменьше коммутаторов - штук 100 от силы, но проблем с памятью не припомню. Но да, т.к. сканит он агрессивно в параллель, то ему нужны на это ресурсы. И этот параллелизм тоже настраивать надо руками(ну по крайней мере я когда разворачивал это делал, давно это было, может сейчас там автоматом разумные значения по дефолту).

У меня это - виртуалка с 4 ядрами и 6 гигами оперативки(половина обычно свободно, но много кэша для SQL-ной БД не бывает). Как сам librenms, так и база - в докере, проблем сейчас не наблюдаю. Раньше была раздражающая интерфейсная проблема с как-бы постоянной подгрузкой инфы(ползунок загрузки вверху экрана где-то по минуте отдуплялся, при том что страница и все данные уже загрузились), после январского апдейта проблема ушла.

Ну и да, надо понимать, что в отличие от Zabbix тут либо поддержка твоего оборудования встроена, либо ты страдаешь - потому что кастомизировать шаблоны оборудования здесь - тот еще адок по сравнению с Zabbix.

Pinkbyte ★★★★★
()
Ответ на: комментарий от Pinkbyte

Ну и да, надо понимать, что в отличие от Zabbix тут либо поддержка твоего оборудования встроена, либо ты страдаешь - потому что кастомизировать шаблоны оборудования здесь - тот еще адок по сравнению с Zabbix.

Ну вот я пока на что не посмотрю натыкаюсь на такую ситуацию, что если что-то поддерживается, то все отлично. Если нет - страдай. У zabbix как-то честнее, стандартные шаблоны разве что в качестве примера годятся, зато свои писать - одно удовольствие.

Kolins ★★★★★
() автор топика

Топикстартеру - ну ты первый начал.

Есть такой замечательный американец James Turnbull. Написал он замечательную книгу The Art of Monitoring.

В качестве системы мониторинга, автор книги выбрал Riemann. Система мониторинга действительна хороша, компактная и работает без проблем.

Только одна проблема - написана она на Clojure, нужно будет изучить Lisp, Clojure, чтобы начать понимать немного в конфигурации.

Nurmukh ★★★
()
Ответ на: комментарий от Nurmukh

Есть такой замечательный американец James Turnbull. Написал он замечательную книгу The Art of Monitoring.

Надо бы перевод поискать или попробовать оригинал осилить, думаю больше пользы принесет

Kolins ★★★★★
() автор топика
Ответ на: комментарий от Harliff

https://learn.netdata.cloud/docs/collecting-metrics/generic-collecting-metrics/snmp-devices ТС вроде это хотел. Вообще netdata, сделана так что из коробки она закроет запросы 95% юзеров. А остальные 5% можно подкрутить.

anonymous_sama ★★★★★
()
Ответ на: комментарий от asdpm

Так это плюс, чтобы где-то исторические данные хранить, без головной боли своей инфраструкторы для этого. Просто ставишь netdata, подключаешь к облаку и все.

А подскажите на какую систему мониторинга посмотреть? (комментарий)

anonymous_sama ★★★★★
()
Последнее исправление: anonymous_sama (всего исправлений: 1)
Ответ на: комментарий от Kolins

В 2025 году другая проблема - многие пакеты уже устарели, в частности, мне пришлось искать аналоги python - graphite - есть реализации на golang. Они вроде работают, но нужно точно сказать не могу. Затем из ubuntu выпили collectd. А он нужен.

Nurmukh ★★★
()