Мониторинг

мониторинг

1

6

В который раз, избитая тема.

Кто чем и __главное что__ мониторит.

Сейчас у меня zabbix + python(zabbix_api) довольно много веба и кастомных проверок для бизнеса.

Пробовал Sensu, cacti, munin.

Zabbix не нравится ручной настройкой и довольно большим количеством false срабатываний(или просто руки кривые)

Не пробовал, но интересно:
http://newrelic.com/
http://okmeter.io/

Ссылка

← freebsd ssh не конектит с внишки Внутри локалки всё работает Помогите советом!

genymotion на debian 8 →

+ страрую ссылочку на полуобзор средств мониторинга https://www.bigpanda.io/monitoringscape/

trofk ★★★
(10.01.16 02:06:35 MSK) автор топика

Ссылка

Локальное у себя подыми Librenms . Есть доклад про него и на LVee

pinachet ★★★★★
(10.01.16 03:26:39 MSK)

Ответ на: комментарий от pinachet 10.01.16 03:26:39 MSK

Посмотрел. Это скорее продукт ориентированный на network/snmp, а мне надо с ориентацией на веб.

Например:
1. Сделать GET/POST/etc на страничку
2. Получить все ссылки на инклуды css/js. Проверить их загружаемость
3. По возможности, исполнить некоторые(которые я укажу или что-то в этом роде) js скрипты со странички и проверить их результат

trofk ★★★
(10.01.16 11:23:20 MSK) автор топика

руки

this. Плюс, не поверишь, даже в тырпрайзе для венды на каждый чих надо писать скрипты руками. Так как модулей для мониторинга именно твоей шняги туда никто не завозит.

Алсо, в случае мониторинга 100500 одинаковых серверов, никто не мешает запихать скрипты в твой хипстсибл (или что там у тебя), а в жабиксе тупо клонировать хост одним кликом, меняя только адрес и имя. Теоретически, даже никто не мешает забить в менеджмент конфигурации автоматическое создание оного хоста (в жабиксе) без участия одмина.

svr4 ☆
(10.01.16 14:52:18 MSK)
Последнее исправление: svr4 10.01.16 14:54:53 MSK (всего исправлений: 4)

Ответ на: комментарий от trofk 10.01.16 11:23:20 MSK

В жабиксе.

1. Искаропки. 2. Пишите скрипты мелким почерком 3. Phantom/selenium, далее п.2.

svr4 ☆
(10.01.16 14:56:05 MSK)

Ссылка

Ответ на: комментарий от trofk 10.01.16 11:23:20 MSK

1. Сделать GET/POST/etc на страничку

Практически любая система мониторинга. Но проверяться будет только http code ( 200, 501, 403 и т.д. )

2. Получить все ссылки на инклуды css/js. Проверить их загружаемость

Есть мнение, что это проще сделать на python + mechanize или python + urllib2

Если сделать скрипт достаточно универсальным ( проверяет не сервис А, а загружаемость css и js с произвольной страницы ), уже его можно будет прикрутить к системе мониторинга

Или пытаться найти готовый проект. Но опять же, ИМХО, это не система мониторинга, а внешнее ПО, которое можно прикрутить к системе мониторинга

3. По возможности, исполнить некоторые(которые я укажу или что-то в этом роде) js скрипты со странички и проверить их результат

Вот это уже жесть, нужен полноценный браузер. ИМХО

router ★★★★★
(10.01.16 15:22:27 MSK)

Ссылка

Ответ на: комментарий от svr4 10.01.16 14:52:18 MSK

Автоматом у меня в icinga2 делается. Новый хост заносится в DNS и в записи TXT описываются какие на нем демоны и fs надо мониторить. Он появляется в icinga2 автоматом, а в ДНСе кроме прочего еще и инфа о серверах хранится. Удобно.

Что нынче принято использовать для мониторинга и оповещениях о проблемах? (комментарий)

anonymous
(10.01.16 16:02:20 MSK)

Ссылка

Ответ на: комментарий от svr4 10.01.16 14:52:18 MSK

Я не знаю как там с вашим энтерпрайзом и виндами в них.

Но я не могу ответить на вопрос бизнеса «модуль такой-то работает?» ответить что nginx отдаёт 200ок. Это не ответ.

router - сейчас я пункты 1 и 2 так и реализую. Пункт 3ий у меня пока в разработке.

Интересно и странно, что никто не создал такой фреймворк для веб мониторинга.

trofk ★★★
(10.01.16 16:30:08 MSK) автор топика

Ответ на: комментарий от trofk 10.01.16 16:30:08 MSK

Но я не могу ответить на вопрос бизнеса «модуль такой-то работает?» ответить что nginx отдаёт 200ок. Это не ответ.

А это и нельзя полностью сваливать на систему мониторинга. Тут много работы для разработчика и тестировщика.

Разработка огромных боевых человекоподобных скриптов, которые полностью эмулируют действия пользователя, потребует гораздо больше времени, чем разработка бизнес-критичного сервиса.

Перед деплоем на продакшн, тестировщики должны проверить логику работы приложения - это их работа, а не мониторинга.

При разработке критичного к простою приложения разработчики должны сами продумать возможность мониторинга наиболее проблемных частей кода. API для проверки работы, получения метрик производительности, вот это всё.

http code 200 означает, что при генерации страницы проблем не было. Этого достаточно для проверки того, что а, веб-сервер и сервер приложений работают, б, контейнер с приложением тоже жив. В мониторинг добавляются все тестовые url. Если приложение отдаёт например xml, json или что там ещё с метриками производительности и результатами самотестирования, его нужно разбирать внешними скриптами

Серьёзно, добавить автоматическую проверку логики работы средствами одной системы мониторинга это здорово. Но гораздо больший эффект будет, если разработчики тоже озаботятся таким вопросом, а перед деплоем на продуктив всё проверяется на QAS'е

Вот как с разработчиками договариваться - это отдельная тема %)

router ★★★★★
(10.01.16 17:04:52 MSK)
Последнее исправление: router 10.01.16 17:06:18 MSK (всего исправлений: 2)

Ответ на: комментарий от router 10.01.16 17:04:52 MSK

Ну, глядишь DevOps скоро везде будет реализован.

PunkoIvan ★★★★
(10.01.16 17:51:32 MSK)

Ссылка

ping-admin тчк ру // thread

~~gh0stwizard~~ ★★★★★
(10.01.16 17:52:52 MSK)

Ссылка

довольно большим количеством false срабатываний(или просто руки кривые)

брать среднее с последниз 3-ех проверок.

snaf ★★★★★
(10.01.16 22:53:45 MSK)

Ссылка

Zabbix. Сетевые железки по snmp (метрики с интерфейсов, утилизация, состояние линков) + пара серверов через zabbix-agent.
Cacti не понравился ручной настройкой и помойкой из rrd-файликов, nagios мало что умеет, больше ничего не смотрел.

Lavos ★★★★★
(10.01.16 23:01:38 MSK)

Ссылка

Ньюрелик для мониторинга - полная херня. Срабатывает обычно после того, как проблема уже исправлена. Для анализа производительности - да, крайне клевая штука.

По остальному тебе роутер уже разложил всё.

leave ★★★★★
(10.01.16 23:33:01 MSK)

Ссылка

Ответ на: комментарий от trofk 10.01.16 16:30:08 MSK

Интересно и странно, что никто не создал такой фреймворк для веб мониторинга.

Это не мониторинг, а функциональные тесты.

A1 ★
(10.01.16 23:36:00 MSK)

Ссылка

Кто

Аз есмь.

Чем

Icinga2

Что

Linux-серверы (пинг, LA, память/своп, нагрузка на сетевые интерфейсы, дисковое пространство/айноды, IOPSы, изменения системных файлов, системное время, аптайм - всё через SNMP, агенты sucks), состояние RAID-контроллеров, софтовых RAID-массивов, SMART-мониторинг, состояние СУБД и репликации (MySQL, PostgreSQL), веб-серверы (время до истечения сертификатов HTTPS, корректность выдачи страницы), сетевое оборудование (состояние интерфейсов + cisco/hp-специфичные SNMP MIBs), всякую прочую сетевую хрень.

nbw ★★★
(11.01.16 02:53:19 MSK)
Последнее исправление: nbw 11.01.16 02:55:01 MSK (всего исправлений: 1)

Ссылка

collectd + cgp (ещё где-то ошмётки munin есть) к этому ещё sentry и livewatch

beastie ★★★★★
(14.01.16 20:34:33 MSK)
Последнее исправление: beastie 14.01.16 20:35:22 MSK (всего исправлений: 1)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← freebsd ssh не конектит с внишки Внутри локалки всё работает Помогите советом!

Admin

genymotion на debian 8 →

Похожие темы