LINUX.ORG.RU

Сервер волшебно зависает


0

2

Сервер зависает совершенно неожиданно, иногда работает несколько недель, иногда раз в неделю зависает.
Причину узнать так и не удается.
На нем под XEN 4 живут 5 серверов, на винты не похоже, с данными все нормально.
Память относительно стабильно держит температуру, хотя 2 планки около 56 (по выводу sensors)

В момент зависания доступа к экрану нет, да и он все-равно уходит в экономный режим, так что не увидеть что там было (кстати можно это вырубить ?)

OpenSUSE 11.3

Как можно узнать почему зависает или прогнать какие тесты ?

man setterm, только это особо врядли поможет.

Тоже самое сейчас у меня. Купил сервер, рандомно виснет. Все 3 летних месяца, собака, проработал без единого зависания, до и после - минимум раз в 3-4 недели зависон. Отдали на тестирование, там уже 1.5 месяца крутят - ничего не виснет. Хотели так отдавать, я настаиваю на замене материнки.

Deleted
()
Ответ на: комментарий от Deleted

аналогично тоже все лето нормально работал, потом доставил памяти - опять нормально, потом неожиданно началось удовольствие

zlofenix
() автор топика
Ответ на: комментарий от zlofenix

Хм... Странно. Попробуйте по крону регулярно снимать состояние системы. Температуру, процессы, заполнение дисков. Может быть это что-то покажет. Погоняйте при полной нагрузке (cpu, io, mem). Может перегрев найдётся или ошибка в памяти. memtest проводили?

adepto
()

поставь мониторинг какой-нибудь (munin, например) и смотри, что меняется перед зависаниями.

madgnu ★★★★★
()

Если с температурой и памятью всё хорошо - проверь скачки напряжения и попробуй посчитать то, сколько потребляют электричества компоненты (вдруг выходной мощности блока питания не хватает"

Zenithar
()
Ответ на: комментарий от Zenithar

стоит zabbix, ничего аномального в том что мониторит нет

iostat
Linux 2.6.34.7-0.5-xen (serv) 12/28/10 _x86_64_ (8 CPU)

avg-cpu: %user %nice %system %iowait %steal %idle
0.05 0.01 0.24 1.27 0.06 98.37

Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
sdb 14.33 166.63 155.89 12563486 11754116
sda 8.07 20.51 46.65 1546510 3517097
scd0 0.00 0.00 0.00 266 0
dm-0 6.22 129.12 25.41 9735680 1915800
dm-1 0.19 1.70 0.54 127987 40678
dm-2 5.77 28.43 42.91 2143929 3235205
dm-3 0.23 2.56 1.00 192961 75540
dm-4 0.00 0.00 0.00 204 0
dm-5 7.93 17.93 45.64 1352233 3441557
dm-6 0.00 0.01 0.00 388 0
dm-7 0.00 0.00 0.00 204 0
dm-8 0.00 0.00 0.00 204 0


sensors
i5k_amb-isa-0000
Adapter: ISA adapter
Ch. 0 DIMM 0: +49.0°C (low = +100.5°C, high = +124.0°C)
Ch. 0 DIMM 1: +46.5°C (low = +99.0°C, high = +124.0°C)
Ch. 1 DIMM 0: +55.0°C (low = +100.5°C, high = +124.0°C)
Ch. 1 DIMM 1: +49.0°C (low = +99.0°C, high = +124.0°C)
Ch. 2 DIMM 0: +55.5°C (low = +100.5°C, high = +124.0°C)
Ch. 2 DIMM 1: +47.5°C (low = +99.0°C, high = +124.0°C)
Ch. 3 DIMM 0: +52.5°C (low = +100.5°C, high = +124.0°C)
Ch. 3 DIMM 1: +45.0°C (low = +99.0°C, high = +124.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Core 0: +40.0°C (high = +84.0°C, crit = +100.0°C)

coretemp-isa-0001
Adapter: ISA adapter
Core 0: +42.0°C (high = +84.0°C, crit = +100.0°C)

coretemp-isa-0002
Adapter: ISA adapter
Core 0: +40.0°C (high = +84.0°C, crit = +100.0°C)

coretemp-isa-0003
Adapter: ISA adapter
Core 0: +38.0°C (high = +84.0°C, crit = +100.0°C)

coretemp-isa-0004
Adapter: ISA adapter
Core 0: +42.0°C (high = +84.0°C, crit = +100.0°C)

coretemp-isa-0005
Adapter: ISA adapter
Core 0: +38.0°C (high = +84.0°C, crit = +100.0°C)

coretemp-isa-0006
Adapter: ISA adapter
Core 0: +42.0°C (high = +84.0°C, crit = +100.0°C)

coretemp-isa-0007
Adapter: ISA adapter
Core 0: +42.0°C (high = +84.0°C, crit = +100.0°C)

w83793-i2c-0-2f
Adapter: SMBus I801 adapter at 0400
VcoreA: +1.10 V (min = +0.00 V, max = +2.05 V)
VcoreB: +1.08 V (min = +0.00 V, max = +2.05 V)
in2: +1.08 V (min = +0.00 V, max = +2.05 V)
in3: +1.47 V (min = +0.00 V, max = +4.08 V)
in4: +1.78 V (min = +0.00 V, max = +4.08 V)
in5: +3.26 V (min = +0.00 V, max = +4.08 V)
in6: +1.01 V (min = +0.00 V, max = +2.04 V)
+5V: +5.02 V (min = +4.52 V, max = +5.50 V)
5VSB: +5.07 V (min = +4.52 V, max = +5.50 V)
Vbat: +3.15 V (min = +2.70 V, max = +3.30 V)
fan1: 14210 RPM (min = 0 RPM)
fan2: 14062 RPM (min = 0 RPM)
fan3: 13636 RPM (min = 0 RPM)
fan4: 13775 RPM (min = 0 RPM)
fan5: 0 RPM (min = 0 RPM)
fan6: 14210 RPM (min = 0 RPM)
fan7: 0 RPM (min = 0 RPM)
fan8: 0 RPM (min = 0 RPM)
fan9: 0 RPM (min = 0 RPM)
fan10: 0 RPM (min = 0 RPM)
temp1: +37.0°C (high = +100.0°C, hyst = +95.0°C) sensor = Intel PECI
temp2: +36.0°C (high = +100.0°C, hyst = +95.0°C) sensor = Intel PECI
temp3: +0.0°C (high = +100.0°C, hyst = +95.0°C) sensor = Intel PECI
temp4: +0.0°C (high = +100.0°C, hyst = +95.0°C) sensor = Intel PECI
temp5: +25.0°C (high = +65.0°C, hyst = +60.0°C) sensor = thermistor
temp6: +31.0°C (high = +65.0°C, hyst = +60.0°C) sensor = thermistor


перегрузиться в мемтест пока нет возможности

zlofenix
() автор топика
Ответ на: комментарий от zlofenix

температура 2х планок памяти почти всегда около 56, что при падении что за неделю до
то что у сенсоров в скобках очевидно или из конфига или он придумал

zlofenix
() автор топика

Конденсаторы! Проверяй/меняй и радуйся дальше.

anonymous327
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.