LINUX.ORG.RU

Настройка Zabbix

 , , ,


0

1

Приветствую,

Кто-нибудь настраивал мониторинг контейнеров docker через Zabbix-сервер? Есть default шаблон «Docker by Zabbix agent 2» под agent2 и в нём не отрабатывается триггер если контейнер отваливается или останавливается принудительно. Сам Item и trigger включен, но в самом триггере присутствует info «The trigger is not discovered anymore and will be deleted in 29d 23h 30m» Есть возможность настроить данный триггер? Заранее спасибо.

The trigger is not discovered anymore

означает, что заббикс не может найти ID за которым следил. Если этот ID снова появится, то заббикс настроит и триггер и все остальное.
В случае докера за ID взято имя контейнера, по моему, которое генерируется при запуске.
Так что надо либо уменьшить промежуток времени, в течении которого заббикс помнит о контейнере, либо задавать имена контейнерам

xgatron
()
26 августа 2022 г.
Ответ на: комментарий от xgatron

Так что надо либо уменьшить промежуток времени, в течении которого заббикс помнит о контейнере, либо задавать имена контейнерам

Имена на контейнерах уже есть, задать промежуток времени на опрос данных контейнеров?

view1390
() автор топика
Ответ на: комментарий от view1390

Имена на контейнерах уже есть

какие? можете пример итемов привести?
Если заббикс говорит, что что-то «is not discovered anymore», значит имена контейнеров не предсказуемы. Либо вы удалили какой-то конкретный контейнер и больше не собираетесь его запускать под таким именем, но по настройкам заббикс будет месяц о нем помнить

задать промежуток времени на опрос данных контейнеров?

тот, который Keep lost resources period
— Note: If set to «0», entities will be deleted immediately. Using «0» is not recommended, since just wrongly editing the filter may end up in the entity being deleted with all the historical data.

xgatron
()
Ответ на: комментарий от xgatron

какие? можете пример итемов привести?

И всё же как настроить триггер, чтобы он срабатывал на остановку и ошибки контейнера/контейнеров. У меня есть итем Container /nginx-server: Exit code: docker.container_info.state.exitcode[«/nginx-server»]

И триггер Container /nginx-server: Container has been stopped with error code: last(/nginx/docker.container_info.state.exitcode[«/nginx-server»])>0 and last(/nginx/docker.container_info.state.running[«/nginx-server»])=0

Итем и триггер включены, но не приходит алерт после остановки контейнера.

view1390
() автор топика
Ответ на: комментарий от view1390

но не приходит алерт после остановки контейнера.

тогда да, можно попробовать уменьшить интервал, но все равно возможны ситуации, что изменение состояния контейнера придется между проверками.
Тут лучше логи парсить. Можно заббиксом, но не всегда удобно

xgatron
()