LINUX.ORG.RU
ФорумAdmin

Вопрос по nagios


0

1

os Debian6 Установил на винду NSClient++ отредактировал NSClient++\NSC.ini

NSClient++\NSC.ini:
password=pass #пароль для мониторинга
allowed_hosts=192.168.0.2 #IP сервера Nagios
[NSClient]
port=12489 #опрашиваемый порт
command_timeout=60 #время ожидания ответа
allow_arguments=1#разрешить передачу аргументов
В руководстве
Password Protection
If you specified a password in the NSClient++ configuration file on the Windows machine, you’ll need
to modify the check_nt command definition to include the password. Open the commands.cfg file for
editing.
vi /usr/local/nagios/etc/objects/commands.cfg
Change the definition of the check_nt command to include the "-s <PASSWORD>" argument (where
PASSWORD is the password you specified on the Windows machine) like this:

define command{
command_name check_nt
command_line $USER1$/check_nt -H $HOSTADDRESS$ -p 12489 -s PASSWORD -v $ARG1$ $ARG2$
}
НО уменя в commands.cfg нет check_nt илежит он в /etc/nagios3 мне необходимо добавить туда эти строки ? Или надо лезть в plugins где лежит nt.cfg и править его непосредственно ?

соль в том, что бы найти, откуда непосредственно вызывается команда check_nt. command_name может быть даже другим. и да, где бы он не лежал, править надо именно там.

dmiceman ★★★★★ ()
Ответ на: комментарий от dmiceman

ну насколько я понял check_nt описан в nt.cfg (/etc/nagios-plugin/config)

привожу его к виду

# 'check_nt' command definition
define command {
        command_name    check_nt
        command_line    /usr/lib/nagios/plugins/check_nt -H '$HOSTADDRESS$' -p 12489 -s pass -v '$ARG1$'
}

# 'check_nscp' command definition
define command {
        command_name    check_nscp
        command_line    /usr/lib/nagios/plugins/check_nt -H '$HOSTADDRESS$' -p 12489 -v '$ARG1$'
}
ребучу nagios всеравно ност не монитрится 

drac753 ★★ ()
Ответ на: комментарий от drac753

а если в check_nscp пароль добавить? :-) это же надо дальше в конфигах смотреть что вызывается: check_nt или check_nscp.

dmiceman ★★★★★ ()
Ответ на: комментарий от drac753

В логах

[1317710198] LOG VERSION: 2.0
[1317710198] Finished daemonizing... (New PID=6789)
[1317710238] SERVICE ALERT: Windows;Nsclient++ Version;CRITICAL;SOFT;1;В соединении отказано
[1317710298] SERVICE ALERT: Windows;Nsclient++ Version;CRITICAL;SOFT;2;В соединении отказано
[1317710358] SERVICE ALERT: Windows;Nsclient++ Version;CRITICAL;SOFT;3;В соединении отказано
[1317710418] SERVICE ALERT: Windows;Nsclient++ Version;CRITICAL;HARD;4;В соединении отказано
[1317710418] SERVICE NOTIFICATION: root;Windows;Nsclient++ Version;CRITICAL;notify-service-by-email;В соединении отказано
[1317711934] Caught SIGTERM, shutting down...
[1317711934] Successfully shutdown... (PID=6789)
[1317711934] Nagios 3.2.1 starting... (PID=7666)
[1317711934] Local time is Tue Oct 04 11:05:34 MSD 2011
[1317711934] LOG VERSION: 2.0
[1317711934] Finished daemonizing... (New PID=7667)

drac753 ★★ ()
Ответ на: комментарий от drac753

Использую check_nt

#Группа Windows машин
define service {
        hostgroup_name                  Winhosts
        service_description             Nsclient++ Version
        check_command                   check_nt!CLIENTVERSION
        use                             generic-service
        }

drac753 ★★ ()
Ответ на: комментарий от drac753

пфф… 12489 — это же порт? а если telnet-ом на него с хоста с нагиосом постучаться?

dmiceman ★★★★★ ()
Ответ на: комментарий от dmiceman

5 сек о как

root@posts:/etc/nagios3/conf.d# telnet 192.168.4.15 12489
Trying 192.168.4.15...
telnet: Unable to connect to remote host: Connection refused

странно в NSClient++\NSC.ini

password=pass #пароль для мониторинга
allowed_hosts=192.168.0.2 #IP сервера Nagios
[NSClient]
port=12489 #опрашиваемый порт
command_timeout=60 #время ожидания ответа
allow_arguments=1#разрешить передачу аргументов

может из-за пароля не пускает ?

drac753 ★★ ()
Ответ на: комментарий от drac753

пароль тут совсем ни причем. nagios делает то что ему сказано — долбится. но то ли это NSC не запущен, то ли не на том порту сидит, то ли файрвол где-то по дороге отлупы шлет (Connection refused — это именно отлуп, от файрвола или от того, что на порту никто не сидит).

dmiceman ★★★★★ ()
Ответ на: комментарий от drac753

похоже клиент на виндовой тачке netstat -a

  TCP    test:epmap             0.0.0.0:0              LISTENING
  TCP    test:microsoft-ds      0.0.0.0:0              LISTENING
  TCP    test:netbios-ssn       0.0.0.0:0              LISTENING
  UDP    test:microsoft-ds      *:*                    
  UDP    test:isakmp            *:*                    
  UDP    test:4500              *:*                    
  UDP    test:ntp               *:*                    
  UDP    test:1025              *:*                    
  UDP    test:1900              *:*                    
  UDP    test:ntp               *:*                    
  UDP    test:netbios-ns        *:*                    
  UDP    test:netbios-dgm       *:*                    
  UDP    test:1900              *:*                    

drac753 ★★ ()
Ответ на: комментарий от drac753

вылез еще один косяк описал сервисы для группы хостов

root@posts:/etc/nagios3/conf.d# cat services_nagios2.cfg 
# check that web services are running
define service {
        hostgroup_name                  http-servers
        service_description             HTTP
        check_command                   check_http
        use                             generic-service
        notification_interval           0 ; set > 0 if you want to be renotified
}

# check that ssh services are running
define service {
        hostgroup_name                  ssh-servers
        service_description             SSH
        check_command                   check_ssh
        use                             generic-service
        notification_interval           0 ; set > 0 if you want to be renotified
}

#Группа Windows машин версия NSClient++
define service {
        hostgroup_name                  Winhosts
        service_description             NSClient++ Version
        check_command                   check_nt!CLIENTVERSION
        use                             generic-service
        }

#Группа Windows машин врням работы без отключения
define service {
        hostgroup_name                  Winhosts
        service_description             UPTIME
        check_command                   check_nt!UPTIME
        use                             generic-service
        }

#Группа Windows машин загрузка проца
define service {
        hostgroup_name                  Winhosts
        service_description             CPU load
        check_command                   check_nt!CPULOAD!-1 5,80,90
        use                             generic-service
        }


#Группа Windows машин размер пмяти на диске
define service {
        hostgroup_name                  Winhosts
        service_description             C:\ Drive space
        check_command                   check_nt!USEDDISKSPACE!-1 c -w 80 -c 90
        use                             generic-service
        }


check_nt

root@posts:/etc/nagios-plugins/config# cat nt.cfg 
# If you are confused about this command definition, cause you was
# reading other suggestions, please have a look into
# /usr/share/doc/nagios-plugins/README.Debian

# 'check_nt' command definition
define command {
        command_name    check_nt
        command_line    /usr/lib/nagios/plugins/check_nt -H '$HOSTADDRESS$' -p 12489 -s pass -v '$ARG1$'
}

# 'check_nscp' command definition
define command {
        command_name    check_nscp
        command_line    /usr/lib/nagios/plugins/check_nt -H '$HOSTADDRESS$' -p 12489 -v '$ARG1$'
}


захожу в веб интерфейс - Uptime и версия проги отображаются а вот загрузка проца и размер памяти на диске нет , в логах

[1317758400] CURRENT SERVICE STATE: Windows;C:\ Drive space;UNKNOWN;HARD;4;missing -l parameters
[1317758400] CURRENT SERVICE STATE: Windows;CPU load;UNKNOWN;HARD;4;missing -l parameters
[1317758400] CURRENT SERVICE STATE: Windows;NSClient++ Version;OK;HARD;1;NSClient++ 0.3.9.329 2011-09-02
[1317758400] CURRENT SERVICE STATE: Windows;UPTIME;OK;HARD;1;System Uptime - 0 day(s) 13 hour(s) 11 minute(s)
[1317758400] CURRENT SERVICE STATE: debiantest;FTP;OK;HARD;1;FTP OK - 0,007 second response time on port 21 [220 Welcome to blah FTP service.]
[1317758400] CURRENT SERVICE STATE: debiantest;HTTP;OK;HARD;1;HTTP OK: HTTP/1.1 200 OK - 453 bytes in 0,003 second response time
[1317758400] CURRENT SERVICE STATE: debiantest;SSH;OK;HARD;1;SSH OK - OpenSSH_5.5p1 Debian-6 (protocol 2.0)
[1317758400] CURRENT SERVICE STATE: localhost;Current Load;OK;HARD;1;OK - load average: 0.00, 0.00, 0.00
[1317758400] CURRENT SERVICE STATE: localhost;Current Users;OK;HARD;1;USERS OK - 2 users currently logged in
[1317758400] CURRENT SERVICE STATE: localhost;Disk Space;OK;HARD;1;DISK OK
[1317758400] CURRENT SERVICE STATE: localhost;HTTP;OK;HARD;1;HTTP OK: HTTP/1.1 200 OK - 453 bytes in 0,004 second response time
[1317758400] CURRENT SERVICE STATE: localhost;SSH;OK;HARD;1;SSH OK - OpenSSH_5.5p1 Debian-6 (protocol 2.0)
[1317758400] CURRENT SERVICE STATE: localhost;Total Processes;OK;HARD;1;PROCS OK: 90 processes
где может быть косяк ?

drac753 ★★ ()
Ответ на: комментарий от drac753

касяк обнаружил

В описании мониторящихся сервисов
#Группа Windows машин загрузка проца
define service {
        hostgroup_name                  Winhosts
        service_description             CPU load
        check_command                   check_nt!CPULOAD!-1 5,80,90
        use                             generic-service
        }

1) не -1 а -l 
2) Еще попутно обнаружен касяк в  официальном руководстве nagios3
define service {
        hostgroup_name                  Winhosts
        service_description             C:\ Drive space
      check_command                   check_nt!USEDDISKSPACE!-l c -w 80 -c 90
        use                             generic-service
        }

неправильно описано - check_command                   check_nt!USEDDISKSPACE!-l c -w 80 -c 90 , нужно check_command                   check_nt!USEDDISKSPACE!-l -c -w 80 -c 90

drac753 ★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.