LINUX.ORG.RU

Вышел Zabbix 4.0

 , , ,


4

4

Состоялся релиз свободной системы мониторинга с открытым исходным кодом Zabbix 4.0. Zabbix – универсальная система для мониторинга производительности и доступности серверов, инженерного и сетевого оборудования, приложений, баз данных, систем виртуализации, контейнеров, ИТ-сервисов, Web-сервисов.

Система реализует полный цикл от сбора данных, их парсинга, анализа получаемых значений, и заканчивая их хранением, визуализацией и рассылкой оповещений, используя правила эскалации. Представляет гибкие возможности расширения методов сбора и оповещений, а также возможности по автоматизации через API. Единый веб-интерфейс реализует централизованное управление конфигурациями мониторинга и распределение прав доступа различным группам пользователей. Код проекта распространяется под лицензией GPLv2.

Zabbix 4.0 - это LTS версия с пятилетней поддержкой. Рекомендуется для пользователей, которые ориентируются на надёжность и длинный цикл внедрения программных продуктов.

Основные улучшения версии 4.0:

  • Новый встроенный тип элемента данных “HTTP агент” для универсального сбора данных по протоколам Rest API, XML, SOAP, JSON RPC, Prometheus и неструктурированных данных
  • Управление пользовательскими правами просмотра проблем, основанное на тэгах
  • Улучшение общей производительности сервера и прокси в среднем на 10-20%
  • Существенное ускорение передачи данных при использовании прокси благодаря компрессии передаваемых данных
  • Новый расширенный виджет для графиков: выбор элементов по шаблону, отображение проблем, и много других усовершенствований
  • Идентификация пользователей позволяющая интегрироваться с single signon решениями
  • Полноэкранный режим киоска для всех страниц секции мониторинга
  • Поддержка удобного просмотра списка проблем в сжатом виде
  • Новый очень практичный селектор выбора периода времени
  • Официальная поддержка ElasticSearch как движка для хранения исторической информации
  • Возможность использования инвентарной информации в тегах проблем
  • Более гибкая работа с проблемами: возможность комментариев без действий, ручного изменения важности проблем
  • Возможность форсирования выполнения проверки или LLD правила из интерфейса
  • Поддержка управления обслуживания устройств с помощью тегов
  • Улучшенные встроенные дашборды, доступные при установке
  • Гибкий фильтр про тегам в списке проблем с дополнительными возможностями
  • Оптимизация интерфейса для людей с нарушениями зрения плюс две дополнительные высококонтрастные темы
  • Возможность поиска проблем по имени
  • Возможность изменить принадлежность устройства к шаблонам при повторной авторегистрации
  • Более сдержанный дизайн виджетов без показа времени обновления
  • Новая проверка vfs.dir.count на стороне агента для рекурсивного подсчёта количества файлов (и не только!) в директории
  • Дублирование собранных данных (значения метрик, проблемы) в локальную файловую систему в режиме реального времени
  • Поддержка условия “не соответствует регулярному выражению” для правил LLD
  • Возможность отправки одного емайл сообщения сразу нескольким получателям
  • Более развёрнутое сообщение об ошибке в случае проблем с доступностью базы данных
  • Разрешено использовать главные элементы данных (master items) для прототипов элементов данных
  • Удалена секция Мониторинг->Триггеры из интерфейса
  • Увеличен размер DNS имени устройств
  • Поддержка макросов вида $1-$9 помечена как устаревшая и будет удалена в версии 5.0

Для перехода с более ранних версий необходима лишь установка новых серверных бинарных файлов (сервер и прокси) и нового интерфейса. Zabbix автоматически проведёт процедуру апгрейда базы данных. Установка новых агентов не требуется.

С полным списком всех изменений вы можете ознакомиться в документации.

>>> Подробности



Проверено: Shaman007 ()
Ответ на: комментарий от splinoz

А как оно на нагрузках ?

Помню лет 7 назад на 500 хостах он тормозил конкретно так и пришлось nagios юзать, так там все летало ... и до сих пор летает а хостов уже намного больше.

mx__ ★★★★ ()
Ответ на: комментарий от mx__

Наверное кто-то сможет ответить по вопросам производительности на основе своего реального опыта, но мы смотрим на такое количество хостов как на маленькую инсталляцию - это даже далеко не средний уровень по нынешним возможностям продукта.

alexvl ()
Ответ на: комментарий от mx__

Я тут на Ютубе ролик видел... Щас поищу... Так там рассказывается, что Магнит мониторит все свои точки Заббиксом. Десятки тысяч точек(=групп узлов сети), сотни тысяч хостов... и 4 скрипта на перле, которые автоматизируют добавление-удаление-discovery новых точек.

А, вот видео: https://youtu.be/5hsYYA7P7II

P.S. Я так понял, что сам основатель Заббикса в треде. alexvl, мое почтение.

omgiafs ()
Ответ на: комментарий от alexvl

alexvl, Вам просто для информации. ФГУП «Российская телевизионная и радиовещательная сеть» (РТРС) в начале строительства сети цифрового телерадиовещания на территории России (строительство только-только завершается) для мониторинга сети использовало ваш продукт. И использует его сейчас, хотя он стал «неофициальным» средством мониторинга. Удобная штука для подобных дел, как оказалось :)

Правда, мониторинг не централизованный, а разрозненный, в каждой области свой сервак, и он никуда ничего не проксирует. Каждый филиал следит за своей кучей оборудования, разбросанной без преувеличения по всей стране. У вас тут опенсорс, бабла не распилишь, поэтому они перешли на DataMiner Cube от SkyLine communications :) Если бы хватило ума в вас вложиться, то и вам бы лучше сделали, и под себя систему подрихтовали, им там в основном надо перерывы вещания фиксировать и на их основе ведомости с протоколами составлять для расчётов с вещателями.

Так что гордитесь :) Даже гос.конторы Заббиксом пользуются :)

omgiafs ()
Ответ на: комментарий от omgiafs

Такие истории не в новинку, я к этому спокойно отношусь. Есть разница: делается ли что-то для галочки, либо по-настоящему с пользой для дела. Во втором случае кому-то необходимо взять на себя ответственность за решение, а это непросто.

alexvl ()

Новый встроенный тип элемента данных “HTTP агент” для универсального сбора данных по протоколам Rest API, XML, SOAP, JSON RPC, Prometheus и неструктурированных данных

Можно выкидывать grafana?

micronekodesu ()

Каковы его плюсы и минусы по сравнению с компонентами Elastic Stack? У Zabbix есть какие-то свои средства сбора данных из логов? Или он может заменить только Kibana?

olegd ()

Недавно пердолися, не осилил с 3.0 до 3.4 обновится. Так и не понял, что нужно делать, чтобы бд нормально обновилась, морда во всю плевалась ошибками из mysql, пришлось откатить. В итоге, вроде, на 3.2 остановился. Ручками наугад поправив базу и баг в скриптах, который проявлялся на php7 и который в 3.4 пофиксили, заработало.

alexvl, я же правильно понимаю, что сервис сам должен бд обновлять?

WitcherGeralt ()
Ответ на: комментарий от gobot

В наборе скриптов, который я нафигачил для установки (на случай, если кому-нибудь придётся повторить) из исходников, файл fix-fping.sh выглядит так:

ln -s $(which fping) /usr/sbin/fping
ln -s $(which fping6) /usr/sbin/fping6

Мб там пути к исполняемым файлам захардкожены. Не помню почему так.

WitcherGeralt ()
Последнее исправление: WitcherGeralt (всего исправлений: 1)

отборное г...цо. написано пыхерами. шаг влево, шаг вправо - валится. подходит только чудо-админам, которые нихрена не соображают в том, что они делают. все инструкции написаны для идиотов: «нажмите сюда, напишите это в этот файл».

anonymous ()

Тут некоторые жаловались, что заббикс не реализует подход «Infrastructure as code», как ему удаётся держаться на плаву без этой ценнейшей инновации?

Pyzia ★★★★ ()
Ответ на: комментарий от WitcherGeralt

Всё верно - при запуске новой версии сервера он автоматически доводит базу данных до правильного состояния.

На самом деле, очень странно слышать о подобных проблемах. Такое бывает, когда пользователи неосторожно модифицируют структуру базы данных.

alexvl ()
Ответ на: комментарий от mx__

Несколько тысяч хостов (а может, и больше десятка тысяч) держит. Правда, коллеги alexvl помогают за бабло, в т.ч. патчами. Но держит. История за год, с каждого хоста, навскидку, в среднем ~60 метрик, ~15 триггеров.

Алсо, alexvl, есть какие-нибудь ломающие изменения по API? 3.4 нам крови попортил немало с переделанными дельтами :(

leave ★★★★★ ()
Ответ на: комментарий от alexvl

К сожалению, при апгрейде они автоматически не появятся, как и новые шаблоны.

что-то мешает или добавить при апгрейде или положить скрипт для добавления?

anonymous ()
Ответ на: комментарий от gobot

Ну я же написал:

Мб там пути к исполняемым файлам захардкожены

Из твоих слов выходит, что нет.

Я не админ в принципе и не админю заббикс в частности, то был разовый квест, так что я вникал ровно до той степени, чтобы оно заработало.

WitcherGeralt ()

Насколько оно пересекается по функциональности и назначению с Telegraf? Имеет смысл только для группы серверов/воркстейшенов? Или для одинокого домашнего сервера с десятком контейнеров тоже подойдет?

totik ()
Ответ на: комментарий от mx__

Почему-то никто об этом тут не сказал, но дело обычно не в количестве хостов. Количество получаемых метрик в секунду и длительность хранения истории гораздо больше скажет о нагрузке.

И в итоге обычно тормозит не сам заббикс, а БД под ним, и тюнить приходится именно базу. В большинстве случаев достаточно просто партиционировать таблицы истории - это даёт, пожалуй, самый большой выхлоп в отношении к затраченным усилиям.

Если ты собираешь несколько тысяч метрик в секунду и хранишь историю неделю - история распухает до нескольких сотен гигов. Тут уже без вариантов приходится накачивать сервер оперативкой, либо использовать SSD для самой базы или кеша.

melkor217 ★★★★★ ()
Последнее исправление: melkor217 (всего исправлений: 1)

В последнее время замечаю, что многие программные поделия, имеющие в названии *LTS , будто бы специально поганятся разработчиками. Особенно визуально. Был же нормальный интерфейс в 3.4. Нет, надо сделать его ущербным, сломав красивые кнопочки на графиках.

xroft ()