LINUX.ORG.RU
ФорумAdmin

Отрицательные значения в Packet loss = -66%, RTA = 593896996864.00 ms

 


0

1

Столкнулся с тем что нагиос ( Nagios Core 3.5.1 ) дает такой ответ

[1484742575] SERVICE ALERT: x.x.x.x ;PING;CRITICAL;SOFT;1;PING CRITICAL - Packet loss = -66%, RTA = 593896996864.00 ms

Напрягает что потеря пакетов приобретает отрицательные значения , и RTA какой огромный .Есть идеи куда копать?

Конфиг стандартный у узла:

define host{
 use generic-switch; 
 host_name xx ; 
    alias xx; 
    address xx     ; 
    hostgroups xx;
    contact_groups admins;
    }

define service{
    use generic-service; 
    host_name xx ; 
    service_description PING; 
    check_command check_ping!200.0,20%!600.0,60%; 
    normal_check_interval 1; 
    retry_check_interval 1; 
    contact_groups admins;
    }
/etc/nagi

★★★★★

Ответ на: комментарий от MrClon

Там все оки, трабла она периодически выскакивает (

pinachet ★★★★★
() автор топика
Ответ на: комментарий от pinachet

Значит это либо глюк системного ping, либо глюк парсера check_ping из нагиоса.

А со временем на машине все хорошо ? Это не виртуальная машина ?

а check_icmp не пробовал использовать ? Я практически сразу отказался от check_ping.

vel ★★★★★
()
Ответ на: комментарий от vel

А со временем на машине все хорошо ? Это не виртуальная машина ?

Это единственная виртуалка работающая на этой физической машине. Со временем ок .

а check_icmp не пробовал использовать ? Я практически сразу отказался от check_ping.

Нет, а чем оно лучше ?

pinachet ★★★★★
() автор топика
Ответ на: комментарий от pinachet

check_ping вызывает системный пинг, а check_icmp - сам реализует icmp ping (он suid-ный как и ping)

check_icmp рекомендуется когда проверяется много хостов.

vel ★★★★★
()
Ответ на: комментарий от pinachet

Нет. Все тоже самое. Я тоже удивлялся. Но он suid-root и не все рискнут, а так есть выбор.

В линкусе есть icmp-сокет доступный не руту, у меня есть поделка - ping-сервер для nagios использующий этот тип сокета.

Но она оценивает не мгновенное состояние какнала/устройства как check_ping (посылающий пачку пингов за короткий интервал), а статистику за период между обращениями (1-Х минут)

При первом обращение запускается пинг (с заданым интервалом, размером и максимальным временем тестирования), а при следующем обращении получаем статистику за время интервала. Анализируется частота потерь по которой можно понять, что устройство не отвечало в течении отрезка времени или оно периодически теряло пакеты.

Одновременно можно тестировать много хостов ( у меня 1 демон тестирует чуть больше сотни хостов). Доступна проверка по ipv4 и по ipv6.

vel ★★★★★
()
Ответ на: комментарий от vel

я перевел, однако проблемы остались почему то (

grep 'Packet loss = -' nagios.log 
[1485121571] SERVICE ALERT: DC_MAIN_switch_6500;PING;CRITICAL;SOFT;1;PING CRITICAL - Packet loss = -66%, RTA = 594048647168.00 ms
[1485128962] SERVICE ALERT: DNS_Server_2;PING;CRITICAL;SOFT;1;PING CRITICAL - Packet loss = -66%, RTA = 594051596288.00 ms
[1485129822] SERVICE ALERT: mrtg;PING;CRITICAL;SOFT;1;PING CRITICAL - Packet loss = -66%, RTA = 594051923968.00 ms
[1485131002] SERVICE ALERT: VSAT_Satellite_Delta_10.50.52.3;PING;CRITICAL;SOFT;1;PING CRITICAL - Packet loss = -66%, RTA = 594052382720.00 ms
[1485131082] SERVICE ALERT: mrtg;PING;CRITICAL;SOFT;1;PING CRITICAL - Packet loss = -66%, RTA = 594052448256.00 ms
[1485138083] SERVICE ALERT: nagios;PING;CRITICAL;SOFT;1;PING CRITICAL - Packet loss = -66%, RTA = 594055200768.00 ms
[1485140421] SERVICE ALERT: NOC_MAIN_switch_6500;PING;CRITICAL;SOFT;1;PING CRITICAL - Packet loss = -66%, RTA = 594056183808.00 ms
[1485140771] SERVICE ALERT: radius_dhcp_NOC;PING;CRITICAL;SOFT;1;PING CRITICAL - Packet loss = -25%, RTA = 297028157440.00 ms
[1485152232] SERVICE ALERT: radius_dhcp_NOC;PING;WARNING;SOFT;1;PING WARNING - DUPLICATES FOUND! Packet loss = -66%, RTA = 7.25 ms

pinachet ★★★★★
() автор топика
Ответ на: комментарий от pinachet

хм, а нет ли одинаковых MAC адресов в той сети?

или временно возникающих петель ? которые потом разруливаются [mr]stp ?

Я бы на ближайшем управляемом коммутаторе посмотрел бы логи...

vel ★★★★★
()
Ответ на: комментарий от pinachet

т.е. dup на localhost ? Ну это совсем странно...

Собирай трафик tcpdump-ом и анализируй. DUP-ы там точно должны быть видны.

vel ★★★★★
()
Ответ на: комментарий от pinachet

PING WARNING - DUPLICATES FOUND!

Собрать трафик и посмотреть. Все остальное - гадание на кофейной гуще.

vel ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.