LINUX.ORG.RU
ФорумAdmin

Проблема с серверами. Отваливается при удачном входе ssh


0

1

Имеем 4 сервера, которые находятся в одной сети ( Linux CentOS 5 ) На первом сервере запущено 90 процессов, которые собирают данные из сети, основные операции производятся с помощью библиотеки cURL. Часть данных ( в основном изображения ) собирается серверами 2,3, 4 и размещается на первый сервер через сетевую файловую систему NFS.

Каждый из серверов 2-4 обслуживает треть процессов первого сервера. Обработка запускается через TCP/IP.

Проблема : иногда первый сервер перестает принимать входящие соединения, включая ssh ( причем логин и пароль проверяется, а шелл не запускается - сессия отваливается по таймату ). При этом процессы сборки на первом сервере продолжают работать ( это видно по тому, что на серверы 2-4 приходят запросы на сборку имиждей ). Но серверы 2-4 не могут сохранить данные на nfs первого сервера и сами начинают уходить в аут ( насколько я понял из-за опции монтирования hard )

Самое плохое то, что в этот момент нет возможности попасть на первый сервер и посмотреть, что на самом деле приводит к такому поведению. Такая ситуация возникала уже 3 раза, все 3 раза приходилось перегружать первый сервер по питанию.


Ответ на: комментарий от val-amart

ну кому нужен ваш холивар? мдк

Dp76
() автор топика
Ответ на: комментарий от val-amart

если серьезно, то шары статично монтируются или автомаунтером? у меня аутомаунтер на паре машин так ядро в аут выносил.

val-amart ★★★★★
()

очевидно где-то память течёт. или как вариант слишком много открытых файлов/сокетов.

на 4-м CentOSе такое себе штатный сквид позволял, ровно с теми-же симптомами.

выход : мониторить, писать/читать логи, крутить ulimit

MKuznetsov ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.