LINUX.ORG.RU
ФорумAdmin

При поднятии узла скрипт оповещения не срабатываем

 ,


0

1

Продолжаю временно мучить нагиос [ Отрицательные значения в Packet loss = -66%, RTA = 593896996864.00 ms ] :) . При падении узла команда отрабатывается, но при поднятии узла ничего не происходит

На узле дергаеться contact_groups admins;

Вот примера контакта и самой группы

define contact{
       contact_name xxxov
       use generic-contact
       alias xx zzz Y
       host_notifications_enabled 1
       service_notifications_enabled 1
       service_notification_period 24x7
       host_notification_period 24x7
       service_notification_options w,u,c,r,f
       host_notification_options d,u,r,f,s
       service_notification_commands notify-service-by-sms
       host_notification_commands notify-host-by-sms
       email xxx@sd.sd
       can_submit_commands 1
}
define contactgroup{
        contactgroup_name       admins
        alias                   Admins
        members                 xxxov
        }


И сам notify .кстати приелетает только при падении узла инфа

define command{
        command_name    notify-host-by-sms
        command_line    /usr/lib64/nagios/plugins/smsend.pl "$NOTIFICATIONTYPE$ Host-$HOSTNAME$ is $HOSTSTATE$"
        }

define command{
        command_name    notify-service-by-sms
        command_line    /usr/lib64/nagios/plugins/smsend.pl  "$NOTIFICATIONTYPE$ Service-$HOSTNAME$/$SERVICEDESC$ is $SERVICESTATE$"
        }

Сама команда довольно топорная и просто дергает url gsm шлюза для отправки смс

#!/usr/bin/perl                                                            
use strict;
use warnings;

use Data::Dumper;
use Text::Unidecode;

my $e = 'xxcxc343';

my $content = $ARGV[0];
$content = unidecode($content);
$content =~ s/ /_/g;
$content =~ s/\\/_/g;
$content =~ s/\//_/g;
$content =~ s/:/_/g;
$content =~ s/\.\./_/g;


my $out = `/usr/lib64/nagios/plugins/check_http -H 10.x.x.x -u "http://10.x.x.x/cgi/WebCGI?1500101=account=voipgsm_yeastar8&password=blabla&port=3&destination=$e&content=$content"`;

Nagios Core 3.5.1

★★★★★

Ответ на: комментарий от mky

Да при чем и SOFT и HARD

nagios.log:13442:[1485171011] HOST ALERT: REMOTE_G DSLAM AAM-1212-51 10.x.x.x;UP;SOFT;1;OK - 10.x.x.x: rta 5.614ms, lost 0%
nagios.log:13444:[1485171011] SERVICE ALERT: REMOTE_K DSLAM AAM-1212-51 10.x.x.x;PING;OK;SOFT;2;OK - 10.x.x.x: rta 6.092ms, lost 0%
nagios.log:13474:[1485171131] HOST ALERT:  REMOTE_S DSLAM AAM-1212-51 10.x.x.x;UP;HARD;1;OK - 10.70.33.241: rta 9.324ms, lost 0%
pinachet ★★★★★
() автор топика
Ответ на: комментарий от pinachet

Скрит нормально выполняется, не остаётся висеть в списке процессов?

Может имеет смысл добавить:

notification_timeout=20

mky ★★★★★
()
Ответ на: комментарий от mky

Скрит нормально выполняется, не остаётся висеть в списке процессов?

да нет не висит и там в конце exit 0 отдает .(там перл кстати)

При падение и подьеме в логах вот это пишеться

[1485260122] HOST ALERT: TEST10.250.3.253;DOWN;SOFT;8;CRITICAL - 10.250.3.253: rta nan, lost 100%
[1485260182] SERVICE ALERT: TEST10.250.3.253;PING;OK;HARD;1;OK - 10.250.3.253: rta 6.160ms, lost 0%
[1485260192] HOST ALERT: TEST10.250.3.253;UP;SOFT;9;OK - 10.250.3.253: rta 1.808ms, lost 0%

pinachet ★★★★★
() автор топика
Ответ на: комментарий от mky

notification_timeout=20

Оно и так стоит в 30 notification_timeout=30

pinachet ★★★★★
() автор топика
Ответ на: комментарий от pinachet

Нагиосом. Если указать ″log_notifications=1″, то должны появляться записи в логе, хотя бы будет понятно, проблема в скрипте или в нагиосе.

mky ★★★★★
()
Ответ на: комментарий от mky

Это уже стояло до этого


# NOTIFICATION LOGGING OPTION                                                                                                                                                               
# If you don't want notifications to be logged, set this value to 0.                                                                                                                        
# If notifications should be logged, set the value to 1.                                                                                                                                    

log_notifications=1

Я не хочу дебагом логи засорять но все таки походу придеться, какие не особо засорящие логи цифры из твоего опыта предлагаешь заюзать ?

# DEBUG LEVEL                                                                                                                                                                               
# This option determines how much (if any) debugging information will                                                                                                                       
# be written to the debug file.  OR values together to log multiple                                                                                                                         
# types of information.                                                                                                                                                                     
# Values:                                                                                                                                                                                   
#          -1 = Everything                                                                                                                                                                  
#          0 = Nothing                                                                                                                                                                      
#          1 = Functions                                                                                                                                                                    
#          2 = Configuration                                                                                                                                                                
#          4 = Process information                                                                                                                                                          
#          8 = Scheduled events                                                                                                                                                             
#          16 = Host/service checks                                                                                                                                                         
#          32 = Notifications                                                                                                                                                               
#          64 = Event broker                                                                                                                                                                
#          128 = External commands                                                                                                                                                          
#          256 = Commands                                                                                                                                                                   
#          512 = Scheduled downtime                                                                                                                                                         
#          1024 = Comments                                                                                                                                                                  
#          2048 = Macros                                                                                                                                                                    
                                                                                                                                                                                            
debug_level=0 

pinachet ★★★★★
() автор топика
Ответ на: комментарий от pinachet

Попробуйте:

debug_level=34
debug_verbosity=2

А ещё можно вставить в начало скрипта логгирование в файл, дата и, допустим, вывод команды ″ps axfuwww″, чтобы убедится, что при DOWN скрипт точно вызывается нагиосом, а не чем-то ещё.

P.S. Насчёт засорения логов. Нагиос, что «исследуется» на боевом сервере, а не на тестовой машине?

mky ★★★★★
()
Ответ на: комментарий от mky

P.S. Насчёт засорения логов. Нагиос, что «исследуется» на боевом сервере, а не на тестовой машине?

тестовая , просто на тестовой я максимально приблизил в продакшенской, чтобы включить и эффекты нагрузки тоже .

Оки по дебагу пройдусь щас

pinachet ★★★★★
() автор топика
Ответ на: комментарий от mky

Дебаг пока ничего не дал, щас отключил use_large_installation_tweaks=1 посмотрим что это даст

pinachet ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.