LINUX.ORG.RU

Вышел Zabbix 5.0 LTS

 , ,


1

2

Состоялся релиз свободной системы мониторинга с открытым исходным кодом Zabbix 5.0 LTS.

Zabbix – универсальная система для мониторинга производительности и доступности серверов, инженерного и сетевого оборудования, приложений, баз данных, систем виртуализации, контейнеров, ИТ-сервисов, веб-сервисов, облачной инфраструктуры.

Система реализует полный цикл от сбора данных, их обработки и преобразования, анализа получаемых данных, и заканчивая хранением этих данных, визуализацией и рассылкой оповещений с использованием правил эскалаций. Также система предоставляет гибкие возможности расширения методов сбора данных и оповещений, а также возможности автоматизации через API. Единый веб-интерфейс реализует централизованное управление конфигурациями мониторинга и распределением прав доступа различным группам пользователей. Код проекта распространяется под лицензией GPLv2.

Zabbix 5.0 - это новая мажорная LTS версия с длинным сроком официальной поддержки. Для пользователей, которые используют не-LTS версии, рекомендуем переход на LTS версии продукта.

Основные улучшения версии 5.0 LTS:

  • Поддержка SAML для решений single sign-on (SSO)
  • Официальная поддержка нового модульного агента для платформ Linux и Windows с поддержкой надёжного хранения данных в локальной файловой системе
  • Более дружелюбный интерфейс с удобной навигацией по меню слева, оптимизирован для широких мониторов
  • Доступен список устройств для обычных пользователей (Monitoring->Hosts)
  • Поддержка пользовательских модулей для расширения функциональности пользовательского интерфейса
  • Возможность отмены подтверждения проблемы
  • Поддержка шаблонов сообщений для нотификаций на уровне медиа типов
  • Отдельная консольная утилита для тестирования скриптов на JavaScript, полезно для работы с вебхуками и препроцессингом
  • Простая конфигурация и упрощение SNMP шаблонов благодаря переносу параметров SNMP на уровень интерфейса хоста
  • Поддержка пользовательских макросов для прототипов хостов
  • Поддержка типа данных Float64
  • Мониторинг доступности устройств с помощью функции nodata() принимает во внимание доступность прокси

Улучшена безопасность и надёжность мониторинга за счёт:

  • Поддержки вебхуков через HTTP прокси
  • Возможности запрета выполнения определённых проверок агентом, поддержка белых и чёрных списков
  • Возможности формировать список используемых протоколов шифрования для TLS соединений
  • Поддержки шифрованных соединений с базой данных MySQL и PostgreSQL
  • Перехода на SHA256 для хранения хешей пользовательских паролей
  • Поддержки секретных макросов для хранения паролей, ключей доступа и другой конфиденциальной информации

Улучшена производительность:

  • Сжатие исторических данных при использовании TimescaleDB
  • Оптимизация производительности интерфейса для миллионов устройств мониторинга

Другие значительные улучшения:

  • Новые операторы препроцессинга для замены текста и получения имени свойств JSON при работе с JSONPath
  • Группировка сообщений в емайл клиенте по событию
  • Возможность использования секретных макросов в имени пользователя и пароля для доступа к IPMI
  • Поддержка триггерами операций сравнения для текстовых данных
  • Новые проверки для автоматического обнаружения метрик производительности под Windows, IPMI сенсоров, JMX метрик
  • Конфигурация всех параметров ODBC мониторинга на уровне отдельной метрики
  • Возможность проверки метрик шаблонов и устройств прямо из интерфейса
  • Поддержка операции массового изменения пользовательских макросов
  • Поддержка фильтра по тегам для некоторых виджетов дашборда
  • Возможность скопировать график из виджета в виде PNG картинки
  • Поддержка API метода для доступа к логу аудита
  • Удалённый мониторинг версий Zabbix компонент
  • Поддержкда макросов {HOST.ID}, {EVENT.DURATION} и {EVENT.TAGSJSON} в нотификациях
  • Поддержка ElasticSearch 7.х
  • Новые шаблонные решения по мониторингу Redis, MySQL, PostgreSQL, Nginx, ClickHouse, Windows, Memcached, HAProxy
  • Поддержка наносекунд для zabbix_sender
  • Возможность сбросить кеш состояния SNMPv3
  • Увеличен размер ключа метрики до 2048 символов, размера сообщения при подтверждении проблемы до 4096 символов

Из коробки Zabbix предлагает интеграцию с:

  • Платформами службы поддержки Jira, Jira ServiceDesk, Redmine, ServiceNow, Zendesk, OTRS, Zammad
  • Системами оповещения пользователей Slack, Pushover, Discord, Telegram, VictorOps, Microsoft Teams, SINGNL4, Mattermost, OpsGenie, PagerDuty

Официальные пакеты доступны для актуальных версий следующих платформ:

  • Linux дистрибутивов RHEL, CentOS, Debian, SuSE, Ubuntu, Raspbian
  • Систем виртуализации на базе VMWare, VirtualBox, Hyper-V, XEN
  • Docker
  • Агенты для всех платформ включая MacOS и MSI для Windows agent

Доступна быстрая установка Zabbix для облачных платформ:

  • AWS, Azure, Google Cloud, Digital Ocean, IBM/RedHat Cloud

Для перехода с более ранних версий необходима лишь установка новых бинарных файлов (сервера и прокси) и нового интерфейса. Zabbix автоматически проведёт процедуру обновления. Установка новых агентов не потребуется.

С полным списком всех изменений вы можете ознакомиться в документации.

>>> Подробности

Система реализует полный цикл от сбора данных, их обработки и преобразования, анализа получаемых данных, и заканчивая хранением этих данных, визуализацией и рассылкой оповещений с использованием правил эскалаций.

думаю, лучше чем «комбайн» описание здесь не придумать

BOSS-NIGGER ()

Официальная поддержка нового модульного агента для платформ Linux и Windows с поддержкой надёжного хранения данных в локальной файловой системе

как это реализовано? почему раньше оно не было надежным?

BOSS-NIGGER ()
Ответ на: комментарий от apmucm

Будет ли шаблон для мониторинга kubernetes? В роадмап было заявлено

а, что, там настолько что-то мудреное, что юзеры не могут сами писать шаблоны? на каком языке вообще пишутся шаблоны и что из себя представляют?

не ТРОЛЛИНГА ради, просто интересно

BOSS-NIGGER ()
Ответ на: комментарий от BOSS-NIGGER

В общем случае сами по себе шаблоны писать не надо. Надо в веб-интерфейсе создать шаблон и указать, какие данные(какого типа, в какой размерности, с какой периодичностью и т.п.) получать. Там же указывается, откуда их получать. Если есть готовые сборщики данных в агенте, этого уже достаточно. Если таковых нет, нужно написать конфиги, в которых указано, кто какие данные вернёт.

Например, нужно мне анализировать логи постфикса. Я в шаблоне завожу переменную postfix.received, указываю тип - целое число. В конфиге для шаблона прописываю, откуда брать значение:

serParameter=postfix.received-full,pflogsumm -h 0 -u 0 --bounce_detail=0 --deferral_detail=0 --reject_detail=0 --smtpd_warning_detail=0 --no_no_msg_size /var/log/mail.log | grep received | awk 'NF == 2' | awk '{print $1}'

Если надо сложнее пишу скрипт на любом языке, который будет принимать в качестве аргумента имя переменной, а возвращать значение. Тогда конфиг для переменных(postfix[recieved,rejected,delivered,etc...]) будет выглядеть так:

UserParameter=postfix[*],/etc/zabbix/scripts/postfix.sh "$1"

Все связанные с шаблоном графики, диаграмы, алерты и тригеры задаются через веб-интерфейс. Если тыкать много кнопочек лень, можно взять заготовку для шаблона и написать всё вручную, потом импортнуть в заббикс. Всё это описание шаблона хранится в xml.

shell-script ★★★★★ ()
Ответ на: комментарий от anonymous

Затем, что Prometheus - это только сбор метрик, к которому надо прикрутить ELK, Grafana, перелопатить руками тонны конфигов и написать такие же тонны сборщиков и обработчиков. Для наблюдения за тремя с половиной микросервисами за чашечкой смузи оно, может и неплохо, но для мониторинга, например, сети предприятия со всеми серверами, оборудованием разного уровня(коммутаторы, роутеры), возможностью построить карту сети, настроить алерты и обработчики ошибок разного уровня для разных груп(SL2, SL3, etc) и т.п. Promrtheus'у, боюсь, не дорасти никогда.

shell-script ★★★★★ ()
Последнее исправление: shell-script (всего исправлений: 1)
Ответ на: комментарий от shell-script

Все так, но заббикс же до сих пор придерживается убогой устаревшей host-based модели, и мониторить им многонодовое приложение - это боль и страдания. https://www.zabbix.com/documentation/current/manual/config/items/applications не предлагать, вообще не то, через API с этим работать по-человечески нельзя

А уж если тебе надо отследить связку из пяти сервисов, которые ходят друг другу в http/mq api - вообще туши фонари. Это при том, что уже больше 15 лет назад на свете был HP (Mercury) BAC, был BMC Patrol, был, в конце концов, OpenView. О микросервисах тогда вообще не думали, это было начало эпохи SOA.

Поэтому IRL приходится скрещивать заббикс, прометей и алерту :(

leave ★★★★★ ()
Ответ на: комментарий от BOSS-NIGGER

Zabbix это комплексное решение для мониторинга IT инфраструктуры и не только. Одно решение для одной задачи. Бизнесу это проще и дешевле.

anonymous ()
Ответ на: комментарий от BOSS-NIGGER

Раньше его не было, метрики хранились в памяти. Сейчас опционально можно хранить собранные агентом метрики на диске. Данные не теряются при неожиданных проблемах.

anonymous ()
Ответ на: комментарий от anonymous

Бизнесу это проще и дешевле.

Маленькому и бестолковому бизнесу.

Который ещё не прочухал пользу от сборки подходящей инфраструктуры из небольших совместимых друг с другом кирпичиков.

alpha ★★★★★ ()
Ответ на: комментарий от anonymous

Везет, у нас без зависимых айтемов жизни нет.

Это я про то, что нам нужны всегда распоследние фичи, без них не ясно как делать мониторинг вообще.

anonymous ()
Ответ на: комментарий от leave

Поэтому IRL приходится скрещивать заббикс, прометей и алерту :(

Согласен. Скрещивать приходится. Просто очень часто приходится видеть громогласные заявления в стиле «Прометей - замена любого мониторинга» или «ELK - универсальный анализатор логов». Что мягко говоря направда.

А что касается host-based и проблем с многонодовыми приложениями, надо смотреть каждый отдельный случай. Мне в своё время удалось решить это с помощью автообнаружения (https://www.zabbix.com/documentation/4.4/manual/discovery/network_discovery). Не без боли, конечно, но в итоге получилось удобно.

shell-script ★★★★★ ()
Ответ на: комментарий от shell-script

До прометея у нас каждая прилага на каждом хосте в зависимости от своей мета-роли (приземление трафика/асинхронные воркеры/рядовая молотилка и т.д.) регала свой набор айтемов и триггеров через апишку. Это как бы работает, но апишка заббикса меееедлееенная, и все плохо с триггерами со сложной логикой («если сервис А кидает больше процента 504 и утилизация сети на редисе сервиса Б выше 80%, при этом не горит флаг maintenance на Б»). Поэтому в итоге у нас адовый форк алерты с кучей оберток и интеграцией с cmdb. Велосипедизм наше все :)

leave ★★★★★ ()
Ответ на: комментарий от alpha

Очень крупному бизнесу проще занести денег интегратору, который сделает OpenView.

На самом деле заббикс вполне успешно живет там, где нету сложных взаимодействий между приложениями. Он отлично справляется с мониторингом сетей, телефонии, серверов - железа, в общем. Базы им смотреть одно удовольствие, готовая статистика на любой вкус. Еще бы возможность удобно накидывать разные айтемы на один график и было бы вообще шикарно.

leave ★★★★★ ()
Ответ на: комментарий от leave

Еще бы возможность удобно накидывать разные айтемы на один график и было бы вообще шикарно.

zabbix это не умеет. но в графане его можно подключить как datasource. а уже графана может всё ;)

router ★★★★★ ()
Ответ на: комментарий от anonymous

ты им пользоваться то пробовал этим новым меню? даже со скрытым меню графики не влезают + его еще и коноебить начинает. я к таким дизайнерским изыскам не привык и не хочу привыкать, просто гвоздями и палками вернул морду 4.4, но пришлось для этого чуток код поменять.

bernd ★★★★★ ()

пару месяцев как переехал на 4.4 .. а тут уже и 5-ка подъехала… походу надо накатить обнову… что там с обратной совместимостью агентов? 4 агент будет работать с 5ым сервером?

jo_b1ack ★★★★ ()
Ответ на: комментарий от leave

Еще бы возможность удобно накидывать разные айтемы на один график и было бы вообще шикарно.

в 4.4 точно есть комплексные гарафики.. там можно накидывать любые айтемы из любых хостов

jo_b1ack ★★★★ ()
Ответ на: комментарий от leave

связку из пяти сервисов, которые ходят друг другу в http/mq api - вообще туши фонари

О, ты вроде шаришь. Есть связка из, допустим, пяти сервисов, которые по цепочке дёргают себя по апи. Нужно как-то мониторить задержку по времени между вторым и четвёртым, например. У каждого вызова свой сквозной идентификатор, на каждый сервис можно поставь агент. Как строить архитектуру мониторинга в таком случае, каки метрики складывать?

ZhAN ★★ ()

Насоветуйте, что сейчас есть модного и удобного в альтернативу заббикса, но не такое монструозное для мониторинга.
срач_thread_go_on

bsdfun ★★★★★ ()
Ответ на: комментарий от anonymous

Раньше его не было, метрики хранились в памяти. Сейчас опционально можно хранить собранные агентом метрики на диске. Данные не теряются при неожиданных проблемах.

понял

BOSS-NIGGER ()
Ответ на: комментарий от bernd

если у кого бомбануло от нового интерфейса

это пробовать надо. кроме причесывания под windows 10 (следуют за лидером индустрии, типично), стало лучше/хуже?

crypt ★★★★★ ()
Ответ на: комментарий от bsdfun

имхо, смысла нет. zabbix вовсе не монструозен. для школы я вообще его запустил на каком-то железе 200х года. прощего его на минималках запустить, а потом включать нужные фичи.

crypt ★★★★★ ()
Ответ на: комментарий от bsdfun

prometheus + grafana + alertmanager разумеется.

Три сервиса по цене одного.

Каждый - достаточно простой в администрировании, тупой даже можно сказать сервис, который делает одну конкретную задачу. Для многих случаев их достаточно держать в stateless-режиме без бекапов, поскольку все конфиги в гите.

Также конфиги в гите убирают необходимось слоя авторизации и разделения прав в каждом приложении, админить одно удовольствие. Необязательно держать одного гуру-админа с правами, который будет выполнять изменения, можно принимать пулл-реквесты от любого мимо проходящего разработчика, который сам добавляет свои алерты или метрики.

alpha ★★★★★ ()