LINUX.ORG.RU

Intel, GPU HANG

 , , ,


0

1

Собственно с некоторых пор наблюдаю стабильное крошилово стима (даже если стим просто занимается скачиванием контента) и/или зависание X'овой сессии (если комбинировать первое с серфингом в хромиуме).

в dmesg присутствует нечто подобное

[ 1201.275596] [drm] stuck on render ring
[ 1201.276446] [drm] GPU HANG: ecode 6:0:0x8566fffc, in steam [4067], reason: Ring hung, action: reset
[ 1201.276448] [drm] GPU hangs can indicate a bug anywhere in the entire gfx stack, including userspace.
[ 1201.276450] [drm] Please file a _new_ bug report on bugs.freedesktop.org against DRI -> DRM/Intel
[ 1201.276451] [drm] drm/i915 developers can then reassign to the right component if it's not a kernel issue.
[ 1201.276453] [drm] The gpu crash dump is required to analyze gpu hangs, so please always attach it.
[ 1201.276455] [drm] GPU crash dump saved to /sys/class/drm/card0/error
[ 1201.283593] drm/i915: Resetting chip after gpu hang
[ 1207.273125] [drm] stuck on render ring
[ 1207.274001] [drm] GPU HANG: ecode 6:0:0x8566fffc, in steam [4067], reason: Ring hung, action: reset
[ 1207.281112] drm/i915: Resetting chip after gpu hang
[ 1208.542858] CIPCServer::Thr[4111]: segfault at 0 ip 00000000ef9493e4 sp 00000000eead4ab0 error 4 in steamclient.so[eeea7000+10d6000]
[ 1257.264715] [drm] stuck on render ring
[ 1257.265606] [drm] GPU HANG: ecode 6:0:0x85eefffc, in steam [4929], reason: Ring hung, action: reset
[ 1257.272707] drm/i915: Resetting chip after gpu hang
[ 1263.262287] [drm] stuck on render ring
[ 1263.263163] [drm] GPU HANG: ecode 6:0:0x85eefffc, in steam [4929], reason: Ring hung, action: reset
[ 1263.270285] drm/i915: Resetting chip after gpu hang
[ 1489.160319] [drm] stuck on render ring
[ 1489.161182] [drm] GPU HANG: ecode 6:0:0x85eefffc, in steam [5185], reason: Ring hung, action: reset
[ 1489.168317] drm/i915: Resetting chip after gpu hang
[ 1495.169955] [drm] stuck on render ring
[ 1495.170821] [drm] GPU HANG: ecode 6:0:0x85eefffc, in steam [5185], reason: Ring hung, action: reset
[ 1495.177948] drm/i915: Resetting chip after gpu hang
[ 1495.545170] CIPCServer::Thr[5212]: segfault at 0 ip 00000000ef9873e4 sp 00000000eeb12bd0 error 4 in steamclient.so[eeee5000+10d6000]
[ 1923.991519] [drm] stuck on render ring
[ 1923.992451] [drm] GPU HANG: ecode 6:0:0x85eefffc, in steam [5569], reason: Ring hung, action: reset
[ 1923.999491] drm/i915: Resetting chip after gpu hang
[ 1930.001190] [drm] stuck on render ring
[ 1930.002104] [drm] GPU HANG: ecode 6:0:0x85eefffc, in steam [5569], reason: Ring hung, action: reset
[ 1930.009168] drm/i915: Resetting chip after gpu hang
[ 1930.381536] CIPCServer::Thr[5596]: segfault at 0 ip 00000000ef9a93e4 sp 00000000eeb34bd0 error 4 in steamclient.so[eef07000+10d6000]

грешил на агрессивную настройку энергопотребления но после отката изменений не наблюдаю. собственно за ~30 минут с последнего ребута стим падал уже 3 раза как видно из лога.

собственно WTF?

Может в этом зондо-браузере есть какие-то настройки по поводу аппаратного ускорения зондовращения?
Попробуй их отключить.
Я же тебя правильно понял, что проблема случается только при использовании хромиума?

Stahl ★★☆ ()
Ответ на: комментарий от Stahl

Нет. Стим делает плохо Intel DRI/DRM и крашится. Если в это время запущен хромиум то все становится совсем плохо.

exception13 ★★★★★ ()
Ответ на: комментарий от exception13

А-а-а... Ну... Просто у стима и хромиума зонды разной системы:)
Продолжай возносить молитву жирномордому Гейбу пока будешь искать стимовский багтрекер. Я даже знаю что тебе там скажут: «вопросами по неУбунтам не занимаемся. Спасибо за обращение. Ваше обращение очень важно для нас»

Stahl ★★☆ ()
Ответ на: комментарий от exception13

Ну тогда я не вижу смысла в треде.

Ответ на wtf - you are enjoying a free software.

zgen ★★★★★ ()
Последнее исправление: zgen (всего исправлений: 1)
Ответ на: комментарий от exception13

значит новый баг, и на 3.19 обновляться не буду, на 3.18 хоть немного стабильности (до этого по несколько раз в день неприятности)

dib2 ★★★★ ()
Ответ на: комментарий от dib2

у меня 100% воспроизводимость. если только стим то креш даже во время установки игоря. если в это время запущен хромиум то только ребут.

exception13 ★★★★★ ()
[ 1208.542858] CIPCServer::Thr[4111]: segfault at 0 ip 00000000ef9493e4 sp 00000000eead4ab0 error 4 in steamclient.so[eeea7000+10d6000]

[ 1495.545170] CIPCServer::Thr[5212]: segfault at 0 ip 00000000ef9873e4 sp 00000000eeb12bd0 error 4 in steamclient.so[eeee5000+10d6000]

[ 1930.381536] CIPCServer::Thr[5596]: segfault at 0 ip 00000000ef9a93e4 sp 00000000eeb34bd0 error 4 in steamclient.so[eef07000+10d6000]

не будем оправдывать кривулькины поделки от интел, но дело видно не совсем в этом

dimon555 ★★★★★ ()

Кстати да, подтверждаю при просмотре ютуба.

ViTeX ★★★★ ()
Ответ на: комментарий от dimon555

Судя по логу сначала происходит GPU hang, и только потом сегфолт Стима. Но даже если допустить, что это не так, в любом случае, падение в юзерспейсе не должно приводить к GPU hang.

RussianNeuroMancer ★★★★★ ()
Ответ на: комментарий от RussianNeuroMancer

Судя по логу сначала происходит GPU hang, и только потом сегфолт Стима.

gpu hang а потом всё равно ресет, видимо в стиме ошибки не проверяют и ловят сегфолт.

dimon555 ★★★★★ ()

лучше уж блоб от амд жрать, чем это. там хоть со вкусом клубники

der_looser ★★ ()
Ответ на: комментарий от RussianNeuroMancer

А вот не факт. ТСу надо открывать новый баг и выкладывать трейс, как в самом начале сказано.

no-dashi ★★★★★ ()

Мне помогло изменение способа акселерации на UXA вместо SNA. Баг очень мутный, с каждым релизом ядра говорят что пофиксили. Ещё пару месяцев и будет новый 12309.

Deleted ()
Ответ на: комментарий от Deleted

Вру, не помогает. Только что словил 4 HANG'а подряд.

exception13, посмотри на вывод sensors, пожалуйста. Есть наблюдение что баг вылазит при перегреве.

Deleted ()

Извиняюсь за некропостинг, но сам вот сейчас ловлю этот баг. Появился после обновления до jessie (после и до текущего testing сохранился). Есть какой-нибудь workaround?

ktan ★★★ ()
Ответ на: комментарий от ktan

пока только не пользоваться стимом. ибо других способов воспроизведения бага я не нашел.

exception13 ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.