LINUX.ORG.RU
ФорумAdmin

Сервак падает - часть 3


0

0

Машина - P4/4Gb RAM. Ядро 2.4.29+openwall+libata+bcm5700(net)+e1000+hpt без smp, acpi=off, режим памяти в ядре - 4Gb.

Винты:
hda - обычный IDE 120 Gb рутовый раздел
sda, sdb - SATA винты 160Gb (драйвер sata_sil)
sdc, sdd - такие-же винты как под рутовым разделом, но подключены к встроенному в материнку HPT372 контроллеру.

Проверил память, отрубил подозрительные винты (оставался только рутовый и SATA), отключил HypherTreading, скомпилил ядро без smp.

Ничего не помагает! Сервак стабильно виснет при высокой нагрузке. :(((

Последний раз при зависании я оказался подконнекченым по ssh с запущеными несколькими сессиями screen. На одном из них был запущен top, на другом через wich отслеживал температуру проца. Так вот эти периодические задачи зависли, но на соседнем скрине работала задача, которая обрабатывала удаленную mysql базу без обращения к винту - она отлично работала. Переключение между скринами в этот момент тоже работало. Как только на свободном скрине пытылся запустить любую команду - она сразу висла.

Подскажите, пожалуста, на что похожи эти симптомы и что можно сделать?

у меня точно такая же ситуация была с сервером dialup - ставил 2.4.28-ow, работает какое-то время - потом намертво виснет, экран черный, клава не отвечает. Кончилось тем, что собрал без ow и все стало нормально.

x97Rang ★★★
()
Ответ на: комментарий от x97Rang

Если ничего не поможет - так и придеться сделать. Хотя, чревато на http серваке. :(

Включил удаленный лог - получил перед повисом сообщение:

Mar 10 20:59:34 localhost kernel: kernel BUG at vmscan.c:409!
Mar 10 20:59:34 localhost kernel: invalid operand: 0000
Mar 10 20:59:34 localhost kernel: CPU: 0
Mar 10 20:59:34 localhost kernel: EIP: 0010:[<c0133aaf>] Not tainted
Mar 10 20:59:34 localhost kernel: EFLAGS: 00010202
Mar 10 20:59:34 localhost kernel: eax: 00000040 ebx: 00000000 ecx: c0c16adc edx: 00000002
Mar 10 20:59:34 localhost kernel: esi: c0c16ac0 edi: c02fa1f8 ebp: 000015f8 esp: f7fc1f44
Mar 10 20:59:34 localhost kernel: ds: 0018 es: 0018 ss: 0018
Mar 10 20:59:35 localhost kernel: Process kswapd (pid: 4, stackpage=f7fc1000)
Mar 10 20:59:35 localhost kernel: Stack: c1648ad0 000001d0 f7fc0000 00000c80 000001d0 0000000c 00000020 000001d0
Mar 10 20:59:35 localhost kernel: c02fa1f8 c02fa1f8 c0133c6d f7fc1f90 000001d0 0000003c 00000020 c0133cf2
Mar 10 20:59:35 localhost kernel: f7fc1f90 f7fc0000 00000000 00000000 c02fa1f8 00000001 f7fc0000 00000000
Mar 10 20:59:35 localhost kernel: Call Trace: [<c0133c6d>] [<c0133cf2>] [<c0133e9c>] [<c0133f08>] [<c013404d>]
Mar 10 20:59:35 localhost kernel: [<c0105000>] [<c010733e>] [<c0133fb0>]
Mar 10 20:59:35 localhost kernel:
Mar 10 20:59:35 localhost kernel: Code: 0f 0b 99 01 6e 93 2b c0 e9 05 fd ff ff c7 00 00 00 00 00 e8
Mar 10 20:59:40 localhost kernel: kernel BUG at vmscan.c:409!

Как перезагрузиться - попробую пересоздать своп раздел. Если упадет - придеться ow исключать. :(

UncleAndy ★★★
() автор топика
Ответ на: комментарий от UncleAndy

А оперативка исправная? У меня (то есть у Линукса :) ) подобные симптомы были 2 раза - один из-за глюкавой памяти, второй - из-за чересчур разогнаного проца.

ser_bur ★★
()

Сочувствую (без иронии)

fagot ★★★★★
()
Ответ на: комментарий от x97Rang

Сколько времени достаточно на 4 Гига на p4 3Gz? Просто сервак удаленный и я живьем не могу контролировать процесс проверки. :(

UncleAndy ★★★
() автор топика
Ответ на: комментарий от UncleAndy

а она работает в цикле, без конца :)

У меня на септроне на 254 мозгов все (шесть?) тесты минут 10-15 кажется занимали. А потом по кругу

fagot ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.