LINUX.ORG.RU

Непонятные «фризы» системы длительностью по несколько минут

 


0

1

Железо: M5A99FX R2.0, CPU AMD Athlon(tm) II X2 240, 8Gb ECC RAM. ubuntu 16.04 (4.4.0-59) x64. Стоит KVM, несколько гостевых систем (win7, linux). Периодически (несколько раз в сутки) машина перестаёт реагировать вообще на всё, сеть, клавиатура... — проходит несколько минут, и всё живёт как ни в чём не бывало. Только часы отстают минут на 5. В логах пусто. Похоже, если пытаться нажимать на клавиши на локальной клаве, в логах ругань на NMI watchdog: Watchdog detected hard LOCKUP on cpu 0, 1. Куда смотреть, чего проверять?

Перегрева, занятости более половины озу, сваппинга, более-менее крупной записи на диск, особенно на флэшку, перед этим точно нет?

anonymous
()
Ответ на: комментарий от Inshallah

Я ж писал

M5A99FX R2.0

dmesg | grep -i edac
[    6.563297] EDAC MC: Ver: 3.0.0
[    6.657899] EDAC amd64: DRAM ECC enabled.
[    6.657910] EDAC amd64: F10h detected (node 0).
[    6.657931] EDAC MC: DCT0 chip selects:
[    6.657932] EDAC amd64: MC: 0:  4096MB 1:  4096MB
[    6.657933] EDAC amd64: MC: 2:     0MB 3:     0MB
[    6.657934] EDAC amd64: MC: 4:     0MB 5:     0MB
[    6.657934] EDAC amd64: MC: 6:     0MB 7:     0MB
[    6.657935] EDAC MC: DCT1 chip selects:
[    6.657935] EDAC amd64: MC: 0:     0MB 1:     0MB
[    6.657936] EDAC amd64: MC: 2:     0MB 3:     0MB
[    6.657937] EDAC amd64: MC: 4:     0MB 5:     0MB
[    6.657937] EDAC amd64: MC: 6:     0MB 7:     0MB
[    6.657938] EDAC amd64: using x4 syndromes.
[    6.657938] EDAC amd64: MCT channel count: 1
[    6.658023] EDAC MC0: Giving out device to module amd64_edac controller F10h: DEV 0000:00:18.2 (INTERRUPT)
[    6.658035] EDAC PCI0: Giving out device to module amd64_edac controller EDAC PCI controller: DEV 0000:00:18.2 (POLLED)
[    6.658035] AMD64 EDAC driver v3.4.0

olegkrutov ★★
() автор топика
Ответ на: Точно нет от olegkrutov

К таким тормозам приводит при определённых обстоятельствах. Там свап в добавок ещё не отключен?

anonymous
()
Ответ на: комментарий от teod0r

Очередной изнасилованный жидами регистрант зачитывает мантры.

anonymous
()
Ответ на: комментарий от teod0r

Отнюдь. Ответственно заявляю это как пользователь amd-шных камней.

Ну а так выше правильно про диск заметили. Надо бы его викторией какой погонять или ещё чем.

WARNING ★★★★
()
Ответ на: комментарий от WARNING

странно. ни разу на AMD не сталкивался с 12309.
если это диск, то как объяснить, что часы останавливаются?

teod0r ★★★★★
()
Ответ на: комментарий от teod0r

как объяснить, что часы останавливаются?

12309 например. Самое поганое будет, если глючит контроллер на материнке. Пока ему не станет совсем плохо, наколенными тестами определить довольно сложно, что это именно он.

WARNING ★★★★
()
Ответ на: комментарий от soomrack

Диск в порядке...

Как минимум ни в логах смарта, ни единой ошибки, ни в логах системы ни единого сообщения ругательного о диске. А уж я на других системах копирую неисправные диски пачками. С различнейшими проблемами. И такого ни разу. В панику, бывало, падало на чипсетах nvidia, а чтоб так — не-а.

olegkrutov ★★
() автор топика
Ответ на: комментарий от iZEN

Неа.

Не диск, ну по крайней мере ни единого указания на него, ни в самом диске, ни в логах. Поставил ядро 4.8, пока сутки полёт нормальный, далее будем посмотреть.

olegkrutov ★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.