LINUX.ORG.RU
ФорумAdmin

[Zabbix] Агент переодически падает.

 


0

1

Привет.

Zabbix агент падает через некоторый промежуток времени падает, влоге следующее:

zabbix_agentd [28004]: [file:'cpustat.c',line:152] lock failed: [22] Invalid argument
 27996:20111028:045318.837 One child process died (PID:28004,exitcode/signal:255). Exiting ...
 27996:20111028:045320.862 Zabbix Agent stopped. Zabbix 1.8.8 (revision 21965).

Идеи, почему это происходит, закончились.

Может кто сталкивался?

★★★

Последнее исправление: SAA (всего исправлений: 1)

Ответ на: комментарий от blind_oracle

К сожалению, обновлять ядра не планируется.

Вы видите взаимосвязь с ядром?

SAA ★★★
() автор топика
Ответ на: комментарий от blind_oracle

У меня есть подозрение на версии headers и прочего.

Так как два хоста, с одинаковыми ядрами, на агент падает переодически, на другом проблем нет.

SAA ★★★
() автор топика
Ответ на: комментарий от SAA

На этой строчке, где оно не может захватить лок, срабатывает zbx_mutex_lock, это часть библиотеки libpthread, которая часть glibc. Так что возможно c glibc какие-то косяки, сравни версии. Headers ядра используются для сборки модулей насколько я помню, а не для юзерспейс софта...

blind_oracle ★★★★★
()
Ответ на: комментарий от blind_oracle

Пока проблема не наблюдается, посмотрим что будет.

На данный момент только начинаем использовать zabbix.

И если Вы не против задам пару вопросов.

1) Нет ли аналога nagstamon как у нагиса?

2) Есть патчи, для dashboard ?(Понимаю что там простой php) Так как количество хостов приличное, не удобно следить за информацией.

SAA ★★★
() автор топика
Ответ на: комментарий от SAA

1) Не знаю, мне в общем и веб-морды хватает, были какие-то плагины для файрфокса кажись, и для андройдов-айфонов программы. 2) Ээ.. Какого рода патчи? На дашборде то вроде показываются только группы хостов, а их обычно много быть не должно.

blind_oracle ★★★★★
()
Ответ на: комментарий от blind_oracle

На дашборде выводятся последние 20 проблем, сейчас я сделал вывож 100 последних проблем, так вот, интерисует как преподать эту информацию информативнее?

SAA ★★★
() автор топика

Все таки поднимаю тему, проблема на некоторых хостах сохраняется:

31598:20111030:103537.529 Sleeping for 1 second(s)
 31591:20111030:103537.537 In update_cpustats()
zabbix_agentd [31591]: [file:'cpustat.c',line:152] lock failed: [22] Invalid argument
 31589:20111030:103537.539 One child process died (PID:31591,exitcode/signal:255). Exiting ...
 31589:20111030:103537.539 zbx_on_exit() called
 31598:20111030:103537.539 Got signal [signal:15(SIGTERM),sender_pid:31589,sender_uid:0,reason:0]. Exiting ...
 31592:20111030:103537.539 Got signal [signal:15(SIGTERM),sender_pid:31589,sender_uid:0,reason:0]. Exiting ...
 31593:20111030:103537.539 Got signal [signal:15(SIGTERM),sender_pid:31589,sender_uid:0,reason:0]. Exiting ...
 31596:20111030:103537.539 Got signal [signal:15(SIGTERM),sender_pid:31589,sender_uid:0,reason:0]. Exiting ...
 31594:20111030:103537.539 Got signal [signal:15(SIGTERM),sender_pid:31589,sender_uid:0,reason:0]. Exiting ...
 31597:20111030:103537.539 Got signal [signal:15(SIGTERM),sender_pid:31589,sender_uid:0,reason:0]. Exiting ...
 31589:20111030:103539.541 Zabbix Agent stopped. Zabbix 1.8.8 (revision 21965).
SAA ★★★
() автор топика
Ответ на: комментарий от SAA

> Все таки поднимаю тему, проблема на некоторых хостах сохраняется:

Радикальное решение - переехать на snmp.

Плюсы переезда: если вдруг по каким причинам избавитесь от zabbix, клиентов не нужно будет переконфигурировать, меняете только серверную часть.

blackst0ne ★★★★★
()
Ответ на: комментарий от blackst0ne

С snmp много проблем, к примеру nagios забирает данные по snmp и не всегда моментально реагирует, если нагрузка на сервере, то он уведомляет позже, чем надо, так как не может вовремя получить данные.

SAA ★★★
() автор топика
Ответ на: комментарий от SAA

> С snmp много проблем, к примеру nagios забирает данные по snmp и не всегда моментально реагирует, если нагрузка на сервере, то он уведомляет позже, чем надо, так как не может вовремя получить данные.

Хочешь сказать, что nice/ionice не решает проблемы?
Если там такие нагрузки, что snmp захлёбывается, то почему zabbix_agent работает?

blackst0ne ★★★★★
()
Ответ на: комментарий от blackst0ne

Агент падает точно не из-за нагрузки., так как сервер не один под наблюдением.

На другом сервере где такая же нагрузка, агент не падает.

SAA ★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.