LINUX.ORG.RU

Что-то где-то посыпалось [Hardware Error], либо цпу либо рам

 


0

1

Система замирает намертво и перезагружается по среди работы. С месяц уже пользуюсь новоприобретённой оперативкой, поэтому думаю что это она виновата, но в логах что-то про цпу пишет:

-- Boot 7fa40dadb765424293e29fb31878fc23 --
Mar 25 21:30:07 sys kernel: [Hardware Error]: System Fatal error.
Mar 25 21:30:07 sys kernel: [Hardware Error]: CPU:0 (17:1:1) MC5_STATUS[-|UE|MiscV|AddrV|PCC|TCC|SyndV|-|-|-]: 0xbea0000000000108
Mar 25 21:30:07 sys kernel: [Hardware Error]: Error Addr: 0x0001ffffb4e947f6
Mar 25 21:30:07 sys kernel: [Hardware Error]: IPID: 0x000500b000000000, Syndrome: 0x000000004d000000
Mär 25 21:30:07 sys kernel: [Hardware Error]: Execution Unit Ext. Error Code: 0
Mar 25 21:30:07 sys kernel: [Hardware Error]: cache level: RESV, tx: GEN, mem-tx: GEN
-- Boot bd0f0bc3ed0949bba3cf39eeea9cc41c --
Apr 13 22:51:02 sys kernel: [Hardware Error]: System Fatal error.
Apr 13 22:51:02 sys kernel: [Hardware Error]: CPU:5 (17:1:1) MC0_STATUS[-|UE|MiscV|-|PCC|TCC|SyndV|-|-|-]: 0xbaa0000000060165
Apr 13 22:51:02 sys kernel: [Hardware Error]: IPID: 0x000000b000000000, Syndrome: 0x000000002d033400
Apr 13 22:51:02 sys kernel: [Hardware Error]: Load Store Unit Ext. Error Code: 6
Apr 13 22:51:02 sys kernel: [Hardware Error]: cache level: L1, tx: DATA, mem-tx: PRF
-- Boot fc569810f387478faa60231e90ba432d --
Apr 14 15:06:21 sys kernel: [Hardware Error]: System Fatal error.
Apr 14 15:06:21 sys kernel: [Hardware Error]: CPU:2 (17:1:1) MC5_STATUS[-|UE|MiscV|AddrV|PCC|TCC|SyndV|-|-|-]: 0xbea0000000000108
Apr 14 15:06:21 sys kernel: [Hardware Error]: Error Addr: 0x0001ffff9b650480
Apr 14 15:06:21 sys kernel: [Hardware Error]: IPID: 0x000500b000000000, Syndrome: 0x000000004d000000
Apr 14 15:06:21 sys kernel: [Hardware Error]: Execution Unit Ext. Error Code: 0
Apr 14 15:06:21 sys kernel: [Hardware Error]: cache level: RESV, tx: GEN, mem-tx: GEN
Apr 14 15:06:21 sys kernel: [Hardware Error]: System Fatal error.
Apr 14 15:06:21 sys kernel: [Hardware Error]: CPU:4 (17:1:1) MC5_STATUS[-|UE|MiscV|AddrV|PCC|TCC|SyndV|-|-|-]: 0xbea0000000000108
Apr 14 15:06:21 sys kernel: [Hardware Error]: Error Addr: 0x0001ffff9c4a6bee
Apr 14 15:06:21 sys kernel: [Hardware Error]: IPID: 0x000500b000000000, Syndrome: 0x000000004d000000
Apr 14 15:06:21 sys kernel: [Hardware Error]: Execution Unit Ext. Error Code: 0
Apr 14 15:06:21 sys kernel: [Hardware Error]: cache level: RESV, tx: GEN, mem-tx: GEN
-- Boot 56f7600eaff84d0586e6a42a9832d16f --
Apr 16 01:47:55 sys kernel: [Hardware Error]: System Fatal error.
Apr 16 01:47:55 sys kernel: [Hardware Error]: CPU:0 (17:1:1) MC5_STATUS[-|UE|MiscV|AddrV|PCC|TCC|SyndV|-|-|-]: 0xbea0000000000108
Apr 16 01:47:55 sys kernel: [Hardware Error]: Error Addr: 0x0001ffff9c2a428e
Apr 16 01:47:55 sys kernel: [Hardware Error]: IPID: 0x000500b000000000, Syndrome: 0x000000004d000000
Apr 16 01:47:55 sys kernel: [Hardware Error]: Execution Unit Ext. Error Code: 0
Apr 16 01:47:55 sys kernel: [Hardware Error]: cache level: RESV, tx: GEN, mem-tx: GEN
Apr 16 01:47:55 sys kernel: [Hardware Error]: System Fatal error.
Apr 16 01:47:55 sys kernel: [Hardware Error]: CPU:7 (17:1:1) MC5_STATUS[-|UE|MiscV|AddrV|PCC|TCC|SyndV|-|-|-]: 0xbea0000000000108
Apr 16 01:47:55 sys kernel: [Hardware Error]: Error Addr: 0x0001ffff9b41a04a
Apr 16 01:47:55 sys kernel: [Hardware Error]: IPID: 0x000500b000000000, Syndrome: 0x000000004d000000
Apr 16 01:47:55 sys kernel: [Hardware Error]: Execution Unit Ext. Error Code: 0
Apr 16 01:47:55 sys kernel: [Hardware Error]: cache level: RESV, tx: GEN, mem-tx: GEN

Что делать в такой ситуации?

Разгон, вольтаж, проца и памяти? Несовместимая «геймерская» память с завышенным напряжением, или наоборот, энергоэффективная? Обновление биос?

anonymous
()

И вообще, выглядит как будто есть проблемы с idle, энергосберегающим режимом. В биосе отключить C5+ или в командной строке ядра.

anonymous
()

С месяц уже пользуюсь новоприобретённой оперативкой

Если используешь обе плашки сразу проверь их отдельно, у меня было, что ноут с разными плашками вставал колом на загрузке.

ya-betmen ★★★★★
()
Ответ на: комментарий от anonymous

При разгоне(которым является xmp/expo) memtest* практически бесполезен, он работает часами там, где стресс тесты валятся сразу.

Ну разгонами не занимаюсь... поэтому сказать ничего не могу.

Atlant ★★★★★
()
Ответ на: комментарий от anonymous

А кто-то реально использует XMP/EXPO вместо того, чтобы задать параметры руками? Не знаю, как оно там работает, но использование профилей на ASUS меняет не только параметры памяти.

Ну и да, использую память с XMP с параметрами JEDEC, только напряжение повысил до стандартного для неё.

anonymous
()

С месяц уже пользуюсь новоприобретённой оперативкой, поэтому думаю что это она виновата,

Проверяется очень просто: поставь старую и проверь.

но в логах что-то про цпу пишет

В логах пишет на каком ядре проца замечена проблема. Разумеется, память сама по себе ничего делать не может, у неё данные спрашивает проц. Вот тут может и указано какое ядро проца общалось с памятью когда случилась проблема. Но вообще не факт, эти коды надо по специальным таблицам (или прогами) расшифровывать, просто читать надписи тут не годится, может ввестись в заблужение.

Самое простое - проверь с другой памятью, а так же проверь эту память в другом компе.

firkax ★★★★★
()