LINUX.ORG.RU

NOC


0

2

nagios light + еще пара утилит для мониторинга.

ранец и банка с едой не мои

>>> Просмотр (1737x1272, 1315 Kb)

★★★

Проверено: JB ()
Последнее исправление: Murg (всего исправлений: 1)

//Моники нужны для быстрого обзора ситуации и что бы пугать нубов тем «как у нас все серьезно».

На NOC ктутиться последняя убунта.

Школота детектед.

pascal ★★★
()

Это не работа.

Меня всегда поражали такие диспетчерские на стопицот мониторов. Толку от этого гипероснащения ноль. Следить за показателями должна машина, а не человек. Даже если какие-то показатели выходят за пределы нормы, то машина должна предпринять действия к устранению неполадок. И только если в атоматическом режиме это невозможно должно появляться сообщение для пользователя, а для этого достаточно одного монитора.

Camel ★★★★★
()

Что это, Бэримор? Тренажёр шэи?

matumba ★★★★★
()
Ответ на: комментарий от Murg

Элементарно. Берётся на работу нормальный начальник отдела, который стимулирует. То-есть лупит палкой. Или круговая порука. У меня никто, никогда такого не позволял, максимум печенька и чаёк. Неужто приятно в суповом запашке потом сидеть?

Aman
()
Ответ на: комментарий от blackst0ne

не знаю, не я ставила. контора не 1й год существует

а к заббиксу можно прикручивать самописные плагины?

Murg ★★★
() автор топика
Ответ на: комментарий от pascal

нет, к сожалению отдел который этим занимается 30 и выше. это уже закоренелые бубунтонавты, их не перевоспитать.

Murg ★★★
() автор топика
Ответ на: Это не работа. от Camel

мы мониторим серваки клиентов. если какойнибудь дятел положил свой кластер, то дежурный должен поднять.

как можно автоматизировать устранение поломок, совершенные юзверем?

Murg ★★★
() автор топика
Ответ на: комментарий от Aman

а зачем?

про суповой запашёк не знаю. я работаю ночью, нас минимум 2е (саппорт и я). сидим в разных концах этажа. можно врубать металл и кататься на велике (пока ктонибудь чтонибудь не положит...)

да и у нас народ в основном на салатики/бутерброды налегает. пахучую еду едят только арабы, но они за компом жрать не привыкли.

времени идти есть в столовую особо нет. даже если дежурного заменяют на время обеда, за пол часа может много чего произойти и не всегда приятного.

Murg ★★★
() автор топика
Ответ на: комментарий от leiche

за этим компом сидят только нубы) да и бубунта мне не нравится.

Murg ★★★
() автор топика

Кухни нет — отстой.

sv75 ★★★★★
()
Ответ на: комментарий от Murg

Murg

а к заббиксу можно прикручивать самописные плагины?


Я не знаю что такое плагины в терминологии nagios, но в zabbix можно прикручивать скрипты.

blackst0ne ★★★★★
()
Ответ на: комментарий от Murg

Человек-машина.

как можно автоматизировать устранение поломок, совершенные юзверем?

Очень просто. Есть состояние, которое мы считаем нормой, например работают демоны Апача, MySQL'я, проверочная страница отдаётся верно, если эти условия нарушаются программа может попытаться выяснить неполадку, в каком месте отклонились от нормы. Возможно, что пользователь может ввести специальную команду вида «запланированы технические работы, 1 час не реагировать на отклонение от нормы». По прошествии часа у оператора появляется сообщение вида «час прошёл, а сервис всё лежит, свяжись с клиентом, проясни ситуацию, продли отбой на час/неделю/год». Человек в данном случае выступает всего лишь ещё одним датчиком, он проверяет состояние другого человека и отвечает программе мониторинга.

Camel ★★★★★
()
Ответ на: Человек-машина. от Camel

запланировать тех.работы можно и юзвери этим пользуются, но есть клиенты - банки, есть геймерские серваки и другие которые за 5 минут простоя теряют большие деньги.

за сервис мониторинга платят не мало,причем именно за то что когда придут 10 сообщений типа «сервер недоступен» + по 5-20 сообщений сервисов на сервер, человек сообразит что лег load balancer, а не десяток отдельных машин.

для геймерских серваков есть отдельный мобильник, который звонит даже если приходит банальная заявка на cиськовый ACL.

конечно близзард хостится не у нас, но есть другой не менее популярный поработитель школоты, который платит за то что бы блондинко подняло_сервак/перенастроила_фаервол/поправила_конфиг_ядра/и_так_далее вот прям щас, за 15 минут в 3 часа ночи.

для простых смертных автоматизация уже давно есть.

Murg ★★★
() автор топика
Ответ на: комментарий от Murg

заявки от узверей типа «сервер даун»

а ping или другие автоматич. средства проверки не так удобно, как живые юзвери? )))

insider ★★★
()
Ответ на: комментарий от Murg

прочитал последнее сообщение и нашел ответ на свой вопрос :)

insider ★★★
()
Ответ на: комментарий от Murg

Мониторинг же.

запланировать тех.работы можно и юзвери этим пользуются, но есть клиенты - банки, есть геймерские серваки и другие которые за 5 минут простоя теряют большие деньги.

Помидор красный, но у трактора дверь наружу открывается. О чём вы вообще? Любой клиент при простое теряет деньги.

за сервис мониторинга платят не мало,причем именно за то что когда придут 10 сообщений типа «сервер недоступен» + по 5-20 сообщений сервисов на сервер, человек сообразит что лег load balancer, а не десяток отдельных машин.

Для вывода 10 сообщений «сервер недоступен» нужно 10 мониторов? Балансировщик нагрузки не мониторится, от него сообщения не приходят? Нет графического отображения сети, на котором было бы видно, что отвалилась целая ветка, а значит причину надо искать в основании этой ветки (балансировщик), а не в конечных узлах?

для геймерских серваков есть отдельный мобильник, который звонит даже если приходит банальная заявка на cиськовый ACL.

Ну и что? Разве я говорил что-то против? Я говорил, что для каждой задачи должен быть веб-интерфейс? Для клиента телефон Поддержки тоже вполне человеко-машинный интерфейс.

платит за то что бы блондинко подняло_сервак/перенастроила_фаервол/поправила_конфиг_ядра/и_так_далее вот прям щас, за 15 минут в 3 часа ночи.

А при чём здесь мониторинг?

Camel ★★★★★
()
Ответ на: Мониторинг же. от Camel

Любой клиент при простое теряет деньги.

количество денег очень разное.

всем клиентам идет сообщение если их сервак не отвечает на пинг. это по дефолту.

Для вывода 10 сообщений «сервер недоступен» нужно 10 мониторов? Балансировщик нагрузки не мониторится, от него сообщения не приходят? Нет графического отображения сети, на котором было бы видно, что отвалилась целая ветка, а значит причину надо искать в основании этой ветки (балансировщик), а не в конечных узлах?

2х моников вполне хватает, но почему нельзя сделать «по кулхацкерски» если у конторы на это есть бабки. я еще не замечала что бы они кому-то мешали.

графическое отображение сети и еще пара плюшек с фотки умышленно убанны.

Про отвалившуюся ветку, ты не совсем представляешь архитекруту. Там скорее роща. Ты вообще представляешь себе хостинговую контору с пятеркой датацентров?

Балагсировщики естественно мониторятся, но если он упадет, все равно придут сообщения о недоступных серверах которые за балансировщиком(ами)

А при чём здесь мониторинг?

при том что дежурный обрабатывает сообщения nagios, пока клиент не подозревает что его сервак упал

Опять же, если тут так все плохо и тупо, может быть есть предложения как улучшить? только не глобально «а вот надо», а конкретно, софт, ссылки или даже пример конфига со скриншотом? чего мелочится, скрин в студию!

Murg ★★★
() автор топика
Ответ на: комментарий от Murg

всем клиентам идет сообщение если их сервак не отвечает на пинг. это по дефолту.

при том что дежурный обрабатывает сообщения nagios, пока клиент не подозревает что его сервак упал

Я один здесь вижу противоречие?

Балагсировщики естественно мониторятся, но если он упадет, все равно придут сообщения о недоступных серверах которые за балансировщиком(ами)

То есть система сбора сообщений «тупая», хотя могла бы быть «умная». Поступило сообщение о недоступности сервера->проверяется доступность узлов по пути к серверу.

2х моников вполне хватает, но почему нельзя сделать «по кулхацкерски» если у конторы на это есть бабки.

То есть я был прав.

Рад, что у вашей конторы водятся лишние деньги. Это как бэ говорит нам, что хоть у вас все не настроено идеально, ещё есть что улучшать, всё равно это значительно лучше чем у большинства конкурентов.

Camel ★★★★★
()
Ответ на: комментарий от Camel

Я один здесь вижу противоречие?

Противочечия нет, по дефолту мониторится пинг. У клиентов которые платят, мониторятся сервисы. Есть разные тарифы.

То есть система сбора сообщений «тупая», хотя могла бы быть «умная». Поступило сообщение о недоступности сервера->проверяется доступность узлов по пути к серверу

Опять же, если тут так все плохо и тупо, может быть есть предложения как улучшить? только не глобально «а вот надо», а конкретно, софт, ссылки или даже пример конфига со скриншотом? чего мелочится, скрин в студию!

не подскажешь как сделать по умному?

Murg ★★★
() автор топика
Ответ на: Подсказываю. от Camel

не подскажешь как сделать по умному?

Только этим и занимаюсь!

хм... значит с системами мониторинга ты не работал и критика не конструктивна?

жаль раньше не заметила что в твоем профиле написанно «Гентушник, дебил, лентяй, неадекват, [...]»

я думала что ты критикуешь потому что работал с системой получше nagios.

Murg ★★★
() автор топика
Ответ на: комментарий от Murg

Лучшее враг хорошего.

я думала что ты критикуешь потому что работал с системой получше nagios.

Я критикую, потому что стараюсь сделать получше.

Camel ★★★★★
()
Ответ на: Лучшее враг хорошего. от Camel

Только этим и занимаюсь!

Я критикую, потому что стараюсь сделать получше.

как то противоречиво.

Murg ★★★
() автор топика
Ответ на: комментарий от Guest_now

никто не заставляет пользоваться канадскими банками

Murg ★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.