когда их несколько и они виртуализированны на разных нодах это называется отказоустойчивостью
Улыбнуло, вы о чем? Есть сервер, центральный, забикс, еще есть забикс-прокси, но забикс кластер - может я чё упустил?
Когда сервер мониторинга зависит от компонентов которые он мониторит - вот это и не правильно. Возьмём, скажем, НА на ноде (RHEL), как вы говорите, в случае падении ноды, забикс поднимется на другой ноде, но паралельно отошлет вам 100500 смсок и емайлов с оповещениями, гарантирую вам минут 20 неприятных минут, пока будете разбираться.
Хотя данный вопрос - это на любителя, и решение о построении системы мониторинга зависит от критичности приложений которые он мониторит.
подскажи мне пожалуйста.
есть необходимость проверки политики и наличия правил в iptables.
все хосты - centos 5/6.
нужна возможность использования в заббиксе некоторых переменных....
что-то вроде
#!/bin/bash
rule=$1
if [ «/sbin/iptables-save | grep $rule» = $rule ];
then
echo 1
else
echo 0
fi
Господа, прошу помощи)
Ошибки на страницах «узлы связи». Z - красная.
Выдаёт - Get value from agent failed: cannot connect to [[192.168.0.65]:10050]: [61] Connection refused
или
Get value from agent failed: cannot connect to [[192.168.0.35]:10050]: [4] Interrupted system call.
Кто может помочь, пытаюсь освоить сей продукт.
root@Zabbix:/ # telnet 192.168.2.165 10050
Trying 192.168.2.165...
Connected to 192.168.2.165.
Escape character is '^]'.
Connection closed by foreign host.
root@Zabbix:/ #
или как это делается?)
### Option: LogFileSize
# Maximum size of log file in MB.
# 0 - disable automatic log rotation.
#
# Mandatory: no
# Range: 0-1024
# Default:
# LogFileSize=1
### Option: DebugLevel
# Specifies debug level
# 0 - no debug
# 1 - critical information
# 2 - error information
# 3 - warnings
# 4 - for debugging (produces lots of information)
#
# Mandatory: no
# Range: 0-4
# Default:
# DebugLevel=3
DebugLevel=4
### Option: SourceIP
# Source IP address for outgoing connections.
#
# Mandatory: no
# Default:
# SourceIP=
### Option: EnableRemoteCommands
# Whether remote commands from Zabbix server are allowed.
# 0 - not allowed
# 1 - allowed
#
# Mandatory: no
# Default:
EnableRemoteCommands=0
### Option: LogRemoteCommands
# Enable logging of executed shell commands as warnings.
# 0 - disabled
# 1 - enabled
#
# Mandatory: no
# Default:
# LogRemoteCommands=0
##### Passive checks related
### Option: Server
# List of comma delimited IP addresses (or hostnames) of Zabbix servers.
# Incoming connections will be accepted only from the hosts listed here.
# No spaces allowed.
# If IPv6 support is enabled then '127.0.0.1', '::127.0.0.1', '::ffff:127.0.0.1' are treated equally.
#
# Mandatory: no
# Default:
# Server=
Server=127.0.0.1,localhost,192.168.0.65
### Option: ListenPort
# Agent will listen on this port for connections from the server.
#
# Mandatory: no
# Range: 1024-32767
# Default:
ListenPort=10050
### Option: ListenIP
# List of comma delimited IP addresses that the agent should listen on.
# First IP address is sent to Zabbix server if connecting to it to retrieve list of active checks.
#
# Mandatory: no
# Default:
# ListenIP=0.0.0.0
### Option: StartAgents
# Number of pre-forked instances of zabbix_agentd that process passive checks.
# If set to 0, disables passive checks and the agent will not listen on any TCP port.
#
# Mandatory: no
# Range: 0-100
# Default:
# StartAgents=3
##### Active checks related
### Option: ServerActive
# List of comma delimited IP:port (or hostname:port) pairs of Zabbix servers for active checks.
# If port is not specified, default port is used.
# IPv6 addresses must be enclosed in square brackets if port for that host is specified.
# If port is not specified, square brackets for IPv6 addresses are optional.
# If this parameter is not specified, active checks are disabled.
# Example: ServerActive=127.0.0.1:20051,zabbix.domain,[::1]:30051,::1,[12fc::1]
#
# Mandatory: no
# Default:
# ServerActive=
ServerActive=192.168.0.65
### Option: Hostname
# Unique, case sensitive hostname.
# Required for active checks and must match hostname as configured on the server.
# Value is acquired from HostnameItem if undefined.
#
# Mandatory: no
# Default:
Hostname=127.0.0.1
### Option: HostnameItem
# Item used for generating Hostname if it is undefined.
# Ignored if Hostname is defined.
#
# Mandatory: no
# Default:
# HostnameItem=system.hostname
### Option: RefreshActiveChecks
# How often list of active checks is refreshed, in seconds.
#
# Mandatory: no
# Range: 60-3600
# Default:
# RefreshActiveChecks=120
### Option: BufferSend
# Do not keep data longer than N seconds in buffer.
#
# Mandatory: no
# Range: 1-3600
# Default:
# BufferSend=5
### Option: BufferSize
# Maximum number of values in a memory buffer. The agent will send
# all collected data to Zabbix server or Proxy if the buffer is full.
#
# Mandatory: no
# Range: 2-65535
# Default:
# BufferSize=100
### Option: MaxLinesPerSecond
# Maximum number of new lines the agent will send per second to Zabbix Server
# or Proxy processing 'log', 'logrt' and 'eventlog' active checks.
# The provided value will be overridden by the parameter 'maxlines',
# provided in 'log', 'logrt' or 'eventlog' item keys.
#
# Mandatory: no
# Range: 1-1000
# Default:
# MaxLinesPerSecond=100
### Option: Alias
# Sets an alias for parameter. It can be useful to substitute long and complex parameter name with a smaller and simpler one.
# For example, if you wish to retrieve paging file usage in percents from the server,
# you may use parameter «perf_counter[\Paging File(_Total)\% Usage]», or you may define an alias by adding the following line to configuration file
# Alias = pg_usage:perf_counter[\Paging File(_Total)\% Usage]
# After that you can use parameter name «pg_usage» to retrieve the same information.
# You can specify as many «Alias» records as you wish.
# Aliases cannot be used for parameters defined in «PerfCounter» configuration file records.
#
# Mandatory: no
# Range:
# Default:
### Option: Timeout
# Spend no more than Timeout seconds on processing
#
# Mandatory: no
# Range: 1-30
# Default:
# Timeout=3
### Option: PerfCounter
# Syntax: <parameter_name>,«<perf_counter_path>»,<period>
# Defines new parameter <parameter_name> which is an average value for system performance counter <perf_counter_path> for the specified time period <period> (in seconds).
# For example, if you wish to receive average number of processor interrupts per second for last minute, you can define new parameter «interrupts» as following:
# PerfCounter = interrupts,«\Processor(0)\Interrupts/sec»,60
# Please note double quotes around performance counter path.
# Samples for calculating average value will be taken every second.
# You may run «typeperf -qx» to get list of all performance counters available in Windows.
#
# Mandatory: no
# Range:
# Default:
### Option: Include
# You may include individual files in the configuration file.
#
# Mandatory: no
# Default:
# Include=
### Option: UnsafeUserParameters
# Allow all characters to be passed in arguments to user-defined parameters.
# 0 - do not allow
# 1 - allow
#
# Mandatory: no
# Range: 0-1
# Default:
# UnsafeUserParameters=0
### Option: UserParameter
# User-defined parameter to monitor. There can be several user-defined parameters.
# Format: UserParameter=<key>,<shell command>
# Note that shell command must not return empty string or EOL only.
# Example: UserParameter=system.test,echo 1
#UserParameter=system.test,echo 1
да читал, что ж делать коли неуч)
будь добр помоги) может есть кфг готовый?
зуббикс на фри на виртуалке, на этом же компе 7-ка.
виртуалка - 192.168.0.65, комп 192.168.2.165
server написал - 192,168,0,65
active server 192,168,0,65:10051
hostname - имя своего компа (C:\>hostname D...v)
Имя клиента в сервере zabbix ( configuration -> hosts ) должно совпадать с тем, что на клиенте указано в конфиге клиента в параметре Hostname. ip адреса клиентов на сервере должны быть указаны правильно
Адрес сервера должен совпадать угадай с одного раза с какими двумя параметрами в конфиге клиента
А если изменить условия топикстартера: мониторить надо 16к хостов, каналы связи и сервисы на этих хостах. Посему важны наглядность, расширяемость и прочие энтерапрайзности. Есть рекомендации?
Ичига. Сама в состоянии определить нестабильность показателя, проста, быстра, мощна. Плагины нагиоса к ней подходят, а они есть готовые на любой случай жизни и в любом дистре, в openwrt тоже, в какое-то железо их вообще зашивают.
По мне - так самое главное, что она не спамит меня не нужной инфой, графики забикса, на практике, нафиг не нужны, а ресурсы на них уходят. В отличии от зяблика, у ичиги нет проблем с обновлением. БД поднимать необязательно, т.е. поднять ее можно где угодно, а умрет она разве что вместе с системой.
Есть удобный клиент для андройда.
Заббикс, да ынтырпрайз, а нагиос тупо стандарт. А ичига - это апгрейженный свободный нагиос.
ичига сигналит о флуктуациях, цепляешься на железку и смотришь в реальном времени что хочешь. Не обязательно ждать неделю, чтобы решить проблемы, разглядывая картинку. забикс *top'ы и дебаг-логи все равно не заменит.