LINUX.ORG.RU

Сообщения Dp76

 

Проблема с серверами. Отваливается при удачном входе ssh

Имеем 4 сервера, которые находятся в одной сети ( Linux CentOS 5 ) На первом сервере запущено 90 процессов, которые собирают данные из сети, основные операции производятся с помощью библиотеки cURL. Часть данных ( в основном изображения ) собирается серверами 2,3, 4 и размещается на первый сервер через сетевую файловую систему NFS.

Каждый из серверов 2-4 обслуживает треть процессов первого сервера. Обработка запускается через TCP/IP.

Проблема : иногда первый сервер перестает принимать входящие соединения, включая ssh ( причем логин и пароль проверяется, а шелл не запускается - сессия отваливается по таймату ). При этом процессы сборки на первом сервере продолжают работать ( это видно по тому, что на серверы 2-4 приходят запросы на сборку имиждей ). Но серверы 2-4 не могут сохранить данные на nfs первого сервера и сами начинают уходить в аут ( насколько я понял из-за опции монтирования hard )

Самое плохое то, что в этот момент нет возможности попасть на первый сервер и посмотреть, что на самом деле приводит к такому поведению. Такая ситуация возникала уже 3 раза, все 3 раза приходилось перегружать первый сервер по питанию.

Dp76
()

RSS подписка на новые темы