LINUX.ORG.RU

Зависает система.


0

0

Есть оборудование: Sun Fire V245, отюда следует что ни клавиатура, ни монитор к нему не подключены. Иногда происходит следующая ситуация - БД, которая крутится на этом сервере просто перестаёт отвечать на запросы. Происходит случайным образом, в разное время, от нагрузки сервера не зависит (ну при высокой загрузке ничего такого не происходит).

При этом сервер пингуется, соединение устанавливается (на уровне обмена SYN - SYN/ACK - ACK), но ни одна программа при этом не работает - ни база, ни ssh, ничего. С консоли тоже не заходит.

После перезагрузки никаких сообщений в логах нет.

В общем вопрос такой - при kernel panic'е система будет отвечать на сетевую активность или нет и будут ли какие-либо записи в логах при этом ?

Сейчас поставил там ноутбук с подцепленным терминалом на последовательном порту - может чего выяснится.

В общем жду советов - не понимаю я в чём проблема, а проблему надо решать.


Ядро живо, иначе оно бы не отвечало на пинги.

Нужно залогиниться заранее с отладочной консоли, дождаться пушного зверька и тогда уже смотреть - какие процессы выжили, работают ли жёсткие диски, etc.

Возможна аппаратная проблема.

anonymous
()
Ответ на: комментарий от anonymous

> Ядро живо, иначе оно бы не отвечало на пинги.

ну я так и подумал, но мало ли.

> Нужно залогиниться заранее с отладочной консоли, дождаться пушного зверька и тогда уже смотреть - какие процессы выжили, работают ли жёсткие диски, etc.

оставил консоль сейчас, но всё равно все эти случаи очень неприятны, потому как база рабочая.

> Возможна аппаратная проблема.

Скорее всего так и есть, но не пойму в чём. По почерку похоже на насмерть залипший жёсткий диск, но SMART говорит что с дисками всё в порядке, дисков там 4 в рейдах, трудно в общем сказать.

Возможна ещё память, но тогда неясно, почему при большой нагрузке он не глючит, а вот при небольшой (как сегодня с утра), скукоживаештся. Память там ECCшная, но старенькая.

В общем нужно срочно диагностировать и менять железо если нужно.

shild
() автор топика
Ответ на: комментарий от sdio

Ну в линухе при незватке памяти упала бы база данных и в логах было бы написано, что сработал OOM-killer. А в солярке как?

anonymous
()
Ответ на: комментарий от sdio

> Предположение о нехватке памяти не рассматривается, что-ли?

ээээ а разве при нехватке памяти умирают все процессы в системе ? Да и в логах пусто, да и непохоже :)

ЗЫ: там стоит linux, а не солярка.

shild
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.