LINUX.ORG.RU

Vega11 периодически отваливается (РЕШЕНО)

 , ,


2

1

Имеется Ryzen 5 2400G со встроенной Vega 11. Штука крайне замечательная, НО иногда видеоядро просто отключается: на экране монитора появляется надпись о том что «источник сигнала не найден» а комп можно перезагрузить только хардресетом. Естественно в tty* перейти не выходит (если бы упали иксы, думаю консоль бы все-равно бы работала?).

amdgpu.dc=1 прописал, не помогает.

Частенько падает, при запущенной игре «Beyond two souls» через Вайн. Второе место по падениям занимает эмулятор Yuzu.

В иных случаях падает реже (закономерности выявить не удалось). Падения не зависят от нагрузки на CPU/GPU/RAM/HDD. Иногда может «просто случиться» на ровном месте.

В dmesg после отвала GPU заглянуть само-собой нет возможности.

Дрова - свободные Дистр - Arco Linux mesa - 21.0.1-1

А попробуй через netconsole посмотреть, что именно отваливается.

AnDoR ★★★★★ ()

Уверен, что с оперативкой все в порядке?

anonymous ()

Это нормально, драйвер amdgpu никогда не починят до такого состояния, чтобы он не падал. Ты ничего не сможешь с этим сделать.

Khnazile ★★★★★ ()
Ответ на: комментарий от Khnazile

Конечно не починят по этому вперед на винду либо ядро 5.6.0 если ты не форумный болтунишка и отвергатель всего хорошего в угоду форумного мнения и стилистики под администрацию

anonymous ()

На помойку, ничего не поможет. Как только будешь уверен что зависание удалось обойти, оно упадёт опять

mittorn ★★★★★ ()

3400G, Ubuntu 20.04.2 LTS, ни единого разрыва. А что за мать?

Nervous ★★★★★ ()
Ответ на: комментарий от anonymous

Сейчас бы говноядра от анонимусов юзать, ага. А Вега с самого начала виснет на ровном месте, в т.ч. на винде. Полярис не виснет, а вега виснет.

Khnazile ★★★★★ ()
Ответ на: комментарий от LongLiveUbuntu

Посылают только дураков, нормальным линуксоидам ЛОР - как мать родная.

anonymous ()

Ryzen 5 PRO 4650G не виснет на UBUNTU 20.04.2.0 Драйвер что в системе, amdgpu, ядро 5.8.0-48 HWE, хотя и с прежними не висло. Какое остальное железо, память, материнка. Какие частотки у памяти в BIOS? Подробнее опишите.

anonymous ()
  1. Что у тебя вернет cat /sys/module/amdgpu/parameters/noretry? Должно быть 0.

  2. 2400G был какой-то проблемный под linux, на phoronix о проблемах неоднократно писали, и на лоре жаловались.

Лично у меня две веги, в десктопе vega3 (Athlon 200GE) и ноутбуке vega8 (Ryzen 3550H), с ними у меня 0 проблем, но я практически не играю, пользуюсь Ubuntu LTS с ядом 5.4.

Aber ★★★★★ ()
Ответ на: комментарий от Aber

с ними у меня 0 проблем, но я практически не играю,

Тут и кроется секрет твоего успеха. Самый верный способ положить Вегу - запустить параллельно программы на vulkan и opengl. При том, сразу после перезагрузки система скорее всего не упадёт, обычно это случается через несколько часов/дней. Видимо, какие-то данные драйвера скрытно портятся, но используются они только в редких пограничных случаях, по этому надёжно воспроизвести баг не получается, трассировка вызовов конкретных программ не приводит к падению.

Khnazile ★★★★★ ()

НО иногда видеоядро просто отключается: на экране монитора появляется надпись о том что «источник сигнала не найден» а комп можно перезагрузить только хардресетом. Естественно в tty* перейти не выходит (если бы упали иксы, думаю консоль бы все-равно бы работала?).

В dmesg после отвала GPU заглянуть само-собой нет возможности.

С чего ты взял что отключается видеоядро? Если была бы проблема именно с видео - работал бы перезапуск по Ctrl-Alt-Del ну или Alt-PrtScr-B на крайний случай. И dmesg разумеется можно посмотреть - он сохраняется в /var/log/messages (или во что-то похожее) если система работает и диск не отвалился.

Если же система виснет целиком - причиной может быть и не видео.

firkax ★★★ ()
Последнее исправление: firkax (всего исправлений: 1 )
Ответ на: комментарий от Khnazile

Ну не знаю, я на процессоре Ryzen 5 PRO 4650G, тоже ведь модифицированная по технологии Vega 7, хоть и распознаётся как AMD Renoir video integrated. Однако я использую и Manjaro с ядрами до 5.10.х включительно, и сейчас вот с Ubuntu 20.04.2.0 HWE 5.8 ядра пишу сюда, и всё отлично. Монитор DVI-D BenQ GW2270 1920x1080, память погнанная до 3600Мгц. Crucial Ballistic 2x8Gb., материна дешманская Gigabyte b550m s2h, кулер Zalman Optima CNPS9 180Вт. И всё пашет сутками и не виснет и в логах чистенько аж душа радуется. НО вот с ядром 5.11.0 HWE беда пока, оно вообще видео не кажет, то есть после grub чёрный экран и никакой реакции ни на что. Но это то точно из-за видео. Драйвер родной из системы же amdgpu не плох в сущности. Glxgear гонял на весь экран, stresstest тоже час гонял. Всё хорошо. Так что… Где-то не там собака порылась. За 5.6 ядро не я топлю, это другой анон. Не знаю почему у него 5.6 образец стабильности. Мне и с 5.8 HWE хорошо в Ubuntu 20.04.2 и в 5.10.х в Manjaro.

anonymous ()

У меня Ryzen 3350G. Свойства системы говорят, что Vega 11. Хотя по спекам 10. И Artix. Тот же Arch. Под wine запускал MK X. Да и в целом при работе - проблем не замечал.

kerby ()
Последнее исправление: kerby (всего исправлений: 1 )
Ответ на: комментарий от targitaj

А, стоп, у меня ubuntu 16.04. Старое ядро?

да

P.S. я в прошлом году сменил 16.04 на 20.04, полет нормальный.

Aber ★★★★★ ()
Ответ на: комментарий от Khnazile

Это нормально, драйвер amdgpu никогда не починят до такого состояния, чтобы он не падал. Ты ничего не сможешь с этим сделать.



но у меня лет 9 не падал

darkenshvein ★★★★★ ()
Ответ на: комментарий от xDShot

xDShot ★★★★★

Это не окончательно избавляет от проблем, увы.

Уверен, что с оперативкой все в порядке?

С оперативкой сложно до конца быть уверенным… Но я гонял разные тесты, запускал компиляцию, рендерил, устанавливал репаки игр, жал и распаковывал большие архивы - полагаю проблема проявилась бы.

Это нормально, драйвер amdgpu никогда не починят до такого состояния, чтобы он не падал. Ты ничего не сможешь с этим сделать.

Вот как? А проприетарный такой же «веселый», или им все-таки реально пользоваться?

… либо ядро 5.6.0 …

А чем именно 5.6.0 такое волшебное?

Сейчас бы говноядра от анонимусов юзать, ага. А Вега с самого начала виснет на ровном месте, в т.ч. на винде.

На ванильном и ЛТС та же петрушка. На Винде кстати вообще ни разу не падало, даже намеренно уронить не удалось.

Что у тебя вернет cat /sys/module/amdgpu/parameters/noretry? Должно быть 0.

cat /sys/module/amdgpu/parameters/noretry
-1

А как ноля добиться и надо ли?

её устойчивость сильно зависит от firmware, которые вроде как часто релизятся

Стоит стандартный, из реп. Новее только из АУРа.


Спеки ПК:

CPU - Ryzen 5 2400G @3.8 (турбобуст отключен)

MB - Gigabyte B450M S2H V2

RAM - Crucial CT8G4DFRA266.M16FG 2x8Gb DDR4 @3200

Video - Vega 11 Частота залочина на 1240MHz

Vochatrak-az-ezm ()
Последнее исправление: Vochatrak-az-ezm (всего исправлений: 1 )
Ответ на: комментарий от Vochatrak-az-ezm

Не знаю что значит -1:

modinfo amdgpu | grep retry
parm:           noretry:Disable retry faults (0 = retry enabled (default), 1 = retry disabled) (int)

У меня ядро 5.4, наверное у тебя новее, тогда ничего трогать ненужно. Проблема была со старыми ядрами, от 2019 года.

А как ноля добиться и надо ли?

Если очень нужно то параметрами ядра указать amdgpu.noretry=0

Aber ★★★★★ ()
Ответ на: комментарий от Vochatrak-az-ezm

Что-то в 5.11.х ядрах поломали с процессорами AMD и встроенным видео. На моём 4650G оно вообще не работает, спасает откат до более ранних, вот с 5.10.х никаких проблем вообще. Тестировал в разных дистрибутивах. Может и у тебя что-то подобное?

anonymous ()

Может и от железа зависить. Шей биос на последний или как в случае с ASRock на старую версию 3.20 или 3.10, как описано здесь. Если дело с биосом материнки, то хоть Винду ставь, а синие экраны будут.

amdredfan ()
Последнее исправление: amdredfan (всего исправлений: 1 )

Так к слову, проприетарные драйвера, проблему не решили.

Vochatrak-az-ezm ()
3 июля 2021 г.
Ответ на: комментарий от Vochatrak-az-ezm

Это не означает, что в онтопике будет ОК, кривой BIOS мог быть протестирован только маздае. У меня 2200G, на ядре 5.4 этой проблемы нет, а до 4.19 была.

inxi -M

damix9 ★★ ()
Ответ на: комментарий от damix9
Machine:   Type: Desktop Mobo: Gigabyte model: B450M S2H V2 v: x.x serial: N/A 
UEFI: American Megatrends v: F1 date: 08/28/2020 

Кстати и на Винде удалось напороться на падение драйвера (правда винда от этого целиком не виснет).

Vochatrak-az-ezm ()
Ответ на: комментарий от damix9

А на ядрах 4.19 - 5.4 как обстоят дела?

Не знаю, проверю.

Бивис уже новее вышел

Не могу прошить, потеряю гарантию. Да и с моим везением…

Vochatrak-az-ezm ()
Последнее исправление: Vochatrak-az-ezm (всего исправлений: 1 )
Ответ на: комментарий от anonymous

Не знаю почему у него 5.6 образец стабильности

Тут всё просто - под него собираются фирменные дрова версии 20.40, которые последние поддерживают OpenCL на APU.
С другой стороны, похоже, 2400G и правда неудачный. В 4650G всё по-другому - на одном кристалле, ZEN2

Кстати, у меня ядро 5.6.13 - последнее 5.6.19 тупо виснет.

Shadow ★★★★★ ()
Последнее исправление: Shadow (всего исправлений: 2 )

2400G для линупса не годится, инфа с фороникса. 3400G вроде нормально робит, они там тесты проводили. В 2400G какой-то неисправимый косяк сидит, так что фтопку.

anonymous ()
Ответ на: комментарий от anonymous

под вендой-то пашет.

Да, а под линупсом не хочет. Ты можешь сам это найти на форониксе. Я б и сам нашел, но очень жарко, еле шевелюсь под вентилятором.

anonymous ()

И почему ещё никто не упомянул про волшебный первый степпинг процессоров с архитектурой Zen? Они же безбожно висли под "онтопиком".

Korchevatel ★★★★★ ()
Ответ на: комментарий от damix9

Не помню, где-то читал. Было написано русским по белому - «прошивка биоса является процедурой ремонта и аннулирует гарантию.»

Vochatrak-az-ezm ()
Ответ на: комментарий от Vochatrak-az-ezm

Это какой-то бред. Самоуправство отдельного ретейлера, его способ съехать с гарантийного случая сославшись на что угодно, не это так скажу что в слоте PCIe есть следы механического воздействия, т.е. недобросовестный продавец просто ищет любой повод чтоб отказать в гарантии.

Aber ★★★★★ ()
1 ноября 2021 г.

Вроде удалось-таки победить баг!!!

в параметры загрузки ядра добавляем:

mdgpu.gttsize=8192 amdgpu.lockup_timeout=1000 amdgpu.gpu_recovery=1 amdgpu.noretry=0 amdgpu.ppfeaturemask=0xfffd3fff amdgpu.deep_color=1 systemd.unified_cgroup_hierarchy=true

И на всякий случай в /etc/environment

AMD_DEBUG=nodcc

После этого рандомные зависания видеоядра замечены небыли.

Vochatrak-az-ezm ()
22 декабря 2021 г.
Ответ на: комментарий от anonymous

Это нужно прописать в /etc/default/grub в строку GRUB_CMDLINE_LINUX_DEFAULT= через пробел.

А AMD_DEBUG=nodcc в /etc/environment

Что до вопроса «как». Из под рута, с помощью любого текстового редактора. Если Plasma то просто без рута открывай и вписывай, он при сохранении пароль запросит.

Потом просто sudo update-grub. После перезагрузки должно все работать.

Vochatrak-az-ezm ()
Последнее исправление: Vochatrak-az-ezm (всего исправлений: 1 )
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.