LINUX.ORG.RU

Зависание ubuntu20.04 на Ryzen5-1600

 


0

1

Ранее обращался по поводу случайного (раз в день - раз в пару недель) мертвого зависания системы. Наконец поймал причину:

root@vak:/home/xxx# dmesg|grep PROC
[    2.475129] mce: [Hardware Error]: PROCESSOR 2:800f11 TIME 1687277732 SOCKET 0 APIC 5 microcode 8001138
root@vak:/home/xxx# dmesg|grep mce
[    2.475113] mce: [Hardware Error]: Machine check events logged
[    2.475115] mce: [Hardware Error]: CPU 8: Machine Check: 0 Bank 5: bea0000000000108
[    2.475123] mce: [Hardware Error]: TSC 0 ADDR 1ffffaa845dbe MISC d012000100000000 SYND 4d000000 IPID 500b000000000 
[    2.475129] mce: [Hardware Error]: PROCESSOR 2:800f11 TIME 1687277732 SOCKET 0 APIC 5 microcode 8001138

Все, что сам смог понять из ИН - это известная причина именно для моего процессора случайного зависания системы, но как это лечится понять не смог

root@vak:/home/xxx# grep -F -m 1 "cpu family" /proc/cpuinfo
cpu family	: 23
root@vak:/home/xxx# dmesg | grep microcode
[    2.474348] microcode: CPU0: patch_level=0x08001138
[    2.474355] microcode: CPU1: patch_level=0x08001138
[    2.474362] microcode: CPU2: patch_level=0x08001138
[    2.474366] microcode: CPU3: patch_level=0x08001138
[    2.474371] microcode: CPU4: patch_level=0x08001138
[    2.474377] microcode: CPU5: patch_level=0x08001138
[    2.474383] microcode: CPU6: patch_level=0x08001138
[    2.474387] microcode: CPU7: patch_level=0x08001138
[    2.474392] microcode: CPU8: patch_level=0x08001138
[    2.474398] microcode: CPU9: patch_level=0x08001138
[    2.474402] microcode: CPU10: patch_level=0x08001138
[    2.474407] microcode: CPU11: patch_level=0x08001138
[    2.474428] microcode: Microcode Update Driver: v2.2.
root@vak:/home/xxx# grub-mkconfig -o /boot/grub/grub.cfg
Sourcing file `/etc/default/grub'
Sourcing file `/etc/default/grub.d/init-select.cfg'
Generating grub configuration file ...
Found linux image: /boot/vmlinuz-5.15.0-73-generic
Found initrd image: /boot/initrd.img-5.15.0-73-generic
Found linux image: /boot/vmlinuz-5.15.0-72-generic
Found initrd image: /boot/initrd.img-5.15.0-72-generic
Found linux image: /boot/vmlinuz-5.15.0-71-generic
Found initrd image: /boot/initrd.img-5.15.0-71-generic
Found linux image: /boot/vmlinuz-5.13.0-52-generic
Found initrd image: /boot/initrd.img-5.13.0-52-generic
Adding boot menu entry for UEFI Firmware Settings
done

Ответ на: комментарий от master_0K

жди фиксов микрокода

Вроде, это вылечено у первых Ryzen5-1600, следующие, как понял, этим не страдают, в виндах исправлено. У меня второй комп Ryzen5-2600 не зависает на такой-же (копия) системе. Компы личные, я пользователь, а не сисадмин.
Если я правильно понял, то должен быть дополнительный файл с микрокодом для grub - у меня его нет, и какой нужен непонятно

valentin630
() автор топика
Последнее исправление: valentin630 (всего исправлений: 1)
Ответ на: комментарий от One

«Когда стану менеджером AMD, обязательно подниму этот вопрос»).

Если без шуток, то положить в ОС микрокод гораздо проще и быстрее (пользователь может прямо и не участвовать в процессе), чем через обновления БИОСа это править (AGESA же про это?).

2023 год на дворе, пора бы исправить

я как-то утверждал на ЛОРе, что производители забивают на поддержку. Тот спор я не выиграл. Вот из-за таких случайных событий потребители (например, я) и думают нехорошо о производителях.

master_0K
()
Ответ на: комментарий от master_0K

чем через обновления БИОСа это править

А кстати, интересно бы узнать у ТС модель материнки (или ноута). Возможно в support уже давно лежит готовая версия биоса с нужными исправлениями, имхо.
А так то на ЛОРе, как я заметил, не спешат обновлять биос. Часто там самый первый, еще с магазина, а на оф. сайте уже с десяток исправлений ждут, но не дождутся. )

krasnh ★★★
()
Ответ на: комментарий от krasnh

на ЛОРе, как я заметил, не спешат обновлять биос

подозреваю вне ЛОРа картина та же.

интересно бы узнать у ТС модель материнки (или ноута). Возможно в support уже давно лежит готовая версия биоса с нужными исправлениями, имхо.

Возможно есть обновления. Как правило, о содержании обновления на сайте производителя общие фразы. Поэтому пользователь может и недогадовыватся насколько ему это необходимо.

master_0K
()

Gigabite B450M, БИОС последний

Так, для общей информации, с оф. сайта. Тем более здесь упоминали AGESA:

F64   12/06/2023   

1.    Checksum : 2E89
2.    Update AMD AGESA V2 1.2.0.8
3.    Optimized performance for 5800X3D
4.    Addresses download assistant vulnerabilities reported by Eclypsium Research


В 2023 уже не включают обновления микрокода в биос? Или просто не пишут об этом, или я отстал от жизни и за это отвечает непонятная ‘хрень’ AGESA? :)

krasnh ★★★
()
Последнее исправление: krasnh (всего исправлений: 1)
Ответ на: комментарий от valentin630

Вы же свою тему («тред») просматриваете? // «выше» – сообщения до моего ответа Вам

master_0K
()
Ответ на: комментарий от master_0K

Вы же свою тему («тред») просматриваете?

Видел я это сообщение на том же птичьем языке сисадминов, непонятном мне, пользователю. Ну, нагуглил чего-то человек, привел какой-то списочек чего-то, посмотрел я на него как баран на новые ворота, ничего не понял… простите великодушно, но это, вроде того - идите вы лесом, там все найдете

valentin630
() автор топика

у меня был AMD Ryzen 5 2600, я не думаю что они сильно отличаются. У меня было что-то похожее, но вылечилось увеличением свопа в два раза. Сколько свап у тебя? Возможно просто память заканчивается, и oomkiller не работает. Swap это файл подкачки.

https://tecadmin.net/change-swap-file-size-in-ubuntu/

Если не умеешь в английский, включи переводчик)

Unixson
()
Последнее исправление: Unixson (всего исправлений: 2)
Ответ на: комментарий от valentin630

пока я себе не выставил в два раза больше свапа чем оперативы, то ubuntu вечно висла. оперативы у меня 32GB но в ubuntu что-то такое намутили что oomkiller не сразу срабатывает. ну или по крайней мере я не разобрался

Unixson
()
Ответ на: комментарий от valentin630

Я точно не сисадмин. Что касается «птичьего языка»/жаргона/сленга – как-то само складывается. Но к теме это имеет самое косвенное отношение.

нагуглил чего-то человек, привел какой-то списочек чего-то, посмотрел я на него как баран на новые ворота, ничего не понял…

Вам уже нашли. ЛОР не любит делать чью-то работу. Это только моё мнение: «Предполагается, что задающий вопрос способен самостоятельно решить свою проблему. Ему требуется только некоторая подсказка». Если что-то непонятно или вызывает затруднения всегда можно уточнить.

Пакеты микрокода из дистрибутива устанавливаются пакетным менеджером. Я предполагаю, что в Ubuntu для этого даже консоль/терминал не потребуется. Сам я не пользователь Ubuntu. Мне привычней, удобней терминал, но это мой выбор.

Установка микрокода из других дистрибутивов для Вас должна выглядеть каким-то трюком. Поэтому углубляться не стану.

простите великодушно, но это, вроде того - идите вы лесом, там все найдете

Это Вы зря. Здесь принято посылать в гугл (и не только). И то, что люди дали адекватные ответы на вопрос ставить им в упрек на мой взгляд не есть хорошо.

master_0K
()
Последнее исправление: master_0K (всего исправлений: 1)
Ответ на: комментарий от valentin630

В свежих биосах пилят поддержку рязаней 5000-й серии. Для старых рязаней они не рекомендуются, т.к. из-за ограниченного объема флэшки bios поддержка старых моделей идет под нож. Для пользователей 1000 и 2000 серий рекомендуются последние версии до добавления поддержки 5000-х

cobold ★★★★★
()
Ответ на: комментарий от master_0K

ЛОР не любит делать чью-то работу.

Опять чешу репу - кто такой ЛОР, ухо-горло-нос, кто его заставляет делать мою работу?

Подобное отношение специалиста, который «подобен флюсу», лично я считаю особо утонченным издевательством над человеком, который пришел за помощью, а его посылают в ГУГЛ («иди туда, не зная куда, найди то, не зная что»), вместо простой инструкции: делай раз, делай 2

valentin630
() автор топика
Последнее исправление: valentin630 (всего исправлений: 1)
Ответ на: комментарий от valentin630

да забей, это месный снобизм. тут же все «серьезные дядьки», академики кафедры теоретического фантазирования. им просто не судьба ответить нормально. свой пердеж нюхают исключительно из бокала с оттопыренным мизинчиком. вся их вежливость заканчивается на общении на «вы», а на самом деле сами токсичнее заводских отходов. они траву то последний раз трогали в 90-е. Женщину примерно в то же время.

Unixson
()
Последнее исправление: Unixson (всего исправлений: 3)
Ответ на: комментарий от valentin630

Подобное отношение специалиста, который «подобен флюсу», лично я считаю особо утонченным издевательством над человеком, который пришел за помощью,

Тебе уже помогли - дали конкретные ссылки на более новый микрокод для проца АМД. Никто не нанимался рассказывать на какие кнопки нажимать - это домашнее задание.
Вообще - жизнь несправедлива! К сожалению, ты можешь пользоваться благами компьютерных технологий только в меру своих знаний. Вся информация доступна в интернете - только тупицы и лентяи не способны ею воспользоваться - увы!

sigurd ★★★★★
()
Ответ на: комментарий от Unixson

это месный снобизм

Есть такое, на русском форуме ubuntu меня забанили «навсегда» после того как я попросил сисадминов не издеваться над пользователями и с формулировкой за то, что я взломал форум и завладел правами модератора, вот такой лицемерный и злобный народишко.

valentin630
() автор топика
Ответ на: комментарий от valentin630

Видел я это сообщение на том же птичьем языке сисадминов, непонятном мне, пользователю. Ну, нагуглил чего-то человек, привел какой-то списочек чего-то, посмотрел я на него как баран на новые ворота, ничего не понял… простите великодушно, но это, вроде того - идите вы лесом, там все найдете

А иди ка ты в игнор. Ещё один новорег форум с техподдержкой попутал. Удачи тебе.

Jameson ★★★★★
()
Ответ на: комментарий от DumLemming

может я конечно слишком резко отреагировал изначально, но я к новичкам нормально отношусь, а не пытаюсь сразу говном человека закидать потому что он что-то не понимает. чувак не шарит про местный расклад, видимо он еще и не шарит хорошо в линуксе.

Unixson
()
Ответ на: комментарий от valentin630

Только перезагрузка sysrq+b

У меня такого не было, висло совсем намертво, а если оно перегружается программно, то не сможет ли оно переключиться на ядерную консоль, а там уже глянуть что с ним?

Тут все возможности

dyb4hzvo
()

Эта проблема называется «дохлый райзен». Покупай новый райзен, пока раза с 5 тебе не повезет.

Еще можно по отключать всякие настройки в биосе, типа вырубить C6, и включить idle current = typical, вместо minimal,(на разных биосах эти пункты назваются по-разному) отключить iommu и т.д.

Но правильный способ - менять процессор пока не найдешь полностью исправный, т.е. способный стабильно работать на дефлотных настройках.

Khnazile ★★★★★
()
Последнее исправление: Khnazile (всего исправлений: 1)
Ответ на: комментарий от Khnazile

Эта проблема называется «дохлый райзен».

Мне, как человеку, проработавшему в физике элементарных частиц уже полвека, странно, что «железо» (процессор) может работать, как плохой контакт. И Райзены и Интелы делаются по одной технологии и на одном и том же оборудовании по одному и тому же техпроцессу.

Я в своих сообщениях сказал, что данная проблема известна для первых Ryzen5-1600, что она лечится загрузкой микрокода через grub, но КАК ЭТО СДЕЛАТЬ сам разобраться схода не смог, попросил помочь, надеясь, что здешние спецы это знают и им незападло поделиться своим знанием, а мне не придется тратить несколько дней на самообразование в ненужной мне сфере знаний. Однако, «что-то пошло не так».

valentin630
() автор топика
Ответ на: комментарий от voidkl

Попробуй в BIOS поставить:

Спасибо за конкретный совет, что-то про это попадалось в ИН, но думал, что это связано только с ноутбуками. Поменял, посмотрим, что будет.

valentin630
() автор топика
Ответ на: комментарий от valentin630

лечится загрузкой микрокода через grub, но КАК…

Просто загрузкой соответствующего ядра, точнее - инитрд.

Примерно вот так выглядит инитрд *бунту 20.04 внутри:

https://ibb.co/4f2zcP0

В правой панели выделен АМД-шный микрокод.

andytux ★★★★★
()
Ответ на: комментарий от krasnh

В некоторых системах, они находятся в разных файлах «инитрд» и все перечисляются в соответствующей строке груба. В *бунту они находятся в одном файле «инитрд».

Если есть для данной версии системы новый АМД-микрокод, и система обновляется, то он установлен и применяется. Прочий «левак» чреват «поломкой системы» и не по зубам ТС.

andytux ★★★★★
()
Ответ на: комментарий от andytux

Похоже никакого нового микрокода для этого AMD нет. В «новых»/«левых» пакетах добавлены фирмвари других серий процессоров. Версия с обновлением фирмвари была слишком идеальной, в реальности всё несколько иначе.

master_0K
()
Ответ на: комментарий от voidkl

"Попробуй в BIOS поставить:Global C-State Control -> disable, Power Supply Idle Control -> Typical Current Idle

Еще раз огромное спасибо!

Три недели комп пашет, не прерываясь, и ни разу не завис!!!
А кто-то говорил… да чего только не говорили, а правильный, главное, ЧЕТКИЙ совет дал только один.

valentin630
() автор топика