LINUX.ORG.RU

Предел андервольтинга для Vega 64

 ,


0

1

Прочитал, что одной из основных причин зае... заевшего ring gfx timeout может быть перегрев GPU и/или проблемы с питанием (ОБС, но это имхо бред - у меня БП на 850 Ватт с 80+ Gold сертификатом), поэтому я решил андервольтнуть свою карточку по полной, чтобы наконец насладиться гей-мингом. Но вот беда - не знаю, на сколько mV можно снижать напряжение с сохранением (или небольшим снижением) тактовой частоты, поэтому спрашиваю у вас совета. Вариант сидеть и ждать артефактов не предлагать - они и так появляются, вместе с полным зависанием, переезд на DisplayPort не помог.

Кажется, amdgpu.noretry=0 работает.

★★★★★

опять рабы кожанки наговаривают

с амд нет проблем

anonymous ()
Ответ на: комментарий от Meyer

Оно для «ring timeouts» на драйвере amdgpu на ядрах 5.2+. Я подозреваю, что ring timeouts намного чаще встречаются на APU, но раз у тебя на дискретке, то и с ней должно помочь. Причина одна и та же ведь – драйвер не пробует обратиться ещё раз, а дохнет по таймауту. А этот параметр отключает такое поведение.

chaos_dremel ★★ ()
Ответ на: комментарий от Khnazile

А что делать-то? Хотел было винду в дуалбут поставить, но она не желает устанавливаться в связи отсутствием какого-то драйвера.

Meyer ★★★★★ ()
Ответ на: комментарий от Meyer

Писать в спортлото. Ты же АМД купил, надо было быть готовым к этому.
Vega нужна исключительно для вычислений. На потребительский рынок она попала только из-за бума майнинга. Для понимания: 7нм вегу (aka Radeon VII) сняли с производство менее чем через 6 месяцев после релиза. Потому что даже сами АМД не верят в то, что остались люди, готовые это покупать. А следующую модификацию веги, Arcturus, вообще планируется поставлять исключительно ынтерпрайзу. Это все, что нужно знать о геймерских перспективах веги.

Кстати, баги могут не пофиксить никогда. Пример: https://bugs.freedesktop.org/show_bug.cgi?id=60879

Khnazile ★★★★★ ()
Ответ на: комментарий от Khnazile

Vega нужна исключительно для вычислений.

В APU же GFX9 ядра? Как у дискретных Vega:

    GFX902/903 = Picasso Graphics (12nm Vega Graphics).
    GFX909 = Renoir Graphics (7nm (?) Vega Graphics).

Так что вполне потребительские.

anonymous ()

не занимайся фигнёй

а почему ты думаешь, что дело в перегреве?

у амд есть кольцевой буфер, точнее их несколько. gfx и compute это запуск шейдеров например. остальные просто не помню как называются.

командный процессор следит не упало ли туда что нибудь и подбирает оттуда командные пакеты. дальше он их «применяет», и когда пакет отработал, он может записать пометку в scratch page и если там признак ожидания уже стоит ещё и прерыванием пнуть. это типа futexа получается.

таймаут наступает когда долго не было прерываний при запущеной задаче. а задача таймаутится потому что у тебя часть страниц незамаплена в видяшный mmu. дальше видяха пытается сделать graceful page fault, но вот тут драйвер/ведро/кто-то ещё обсираются. скорее всего они просто не видят в уведомленях статус «pagefault, шейдер вытеснен»

anonymous ()
Ответ на: комментарий от anonymous

Они на самом деле чуть другие, более совершенные. Например, APU умеют аппаратно декодировать VP9, а «десктопные» веги - нет. Короче, хотя эти продукты и относятся к одному поколению, они разные.

Khnazile ★★★★★ ()
Ответ на: комментарий от Meyer

Эх, если бы знал - купил бы rx590

Он кстати, изначально не работал под линуксом. Там были какие-то изменения, которые не отразили в документации для разработчиков драйверов, и на старте продаж эти карты тупо на могли быть проинициализированы драйвером. Так что вот...

Khnazile ★★★★★ ()

они и так появляются, вместе с полным зависанием,

Может поздно уже пить боржом и надо покупать новую карту взамен неисправной нынешней?

torvn77 ★★★★★ ()
Ответ на: комментарий от Meyer

Тогда тебе может просто частоту её работы снизить?
(как не знаю, начинать надо с утилит и заканчивать заменой кварца)

torvn77 ★★★★★ ()
Последнее исправление: torvn77 (всего исправлений: 1)
Ответ на: комментарий от Meyer

Не помогало. Да и вообще это известная драма с 56/64 вегой и радеоном 7 под линуксом.

Мне кажется, это частично аппаратная проблема. Если ты почитаешь сообщения с гитлаба по ссылке, которую я кидал, то увидишь, что зависания происходят когда карта переключается в самое нижнее энергоэффективное состояние.
Я наблюдал подобную проблему с полярисом под виндой(!). В линуксах полярис никогда не достигает максимально энергоэффективного режима из-за особенностей работы с дисплеями.

Моя версия: карты АМД очень горячие (это правда), и чтобы не допустить перегрева АМД использует очень агрессивное снижение частот, и даже отключение целых блоков. Но технология все еще сырая, и склонна к состояниям гонки, возможно на аппаратном уровне.

Да, еще подобная проблема есть в процессорах Ryzen первого поколения, многим из них надо в биосе запрещать C-states, иначе возможны случайные зависания. Совпадение?

Khnazile ★★★★★ ()
Ответ на: комментарий от Khnazile

Мне кажется, это частично аппаратная проблема. Если ты почитаешь сообщения с гитлаба по ссылке, которую я кидал, то увидишь, что зависания происходят когда карта переключается в самое нижнее энергоэффективное состояние.

Хм... Мне казалось, что при установленном параметре amdgpu.ppfeaturemask=0xffffffff видеокарта в pstate 0 не переключается.

Meyer ★★★★★ ()
Ответ на: комментарий от Meyer

Хм... Мне казалось, что при установленном параметре amdgpu.ppfeaturemask=0xffffffff видеокарта в pstate 0 не переключается.

Она не переключается для экономии энергии в простое, но под нагрузкой во избежание перегрева все равно будет тормозить блоки. На сколько я понял, вега в этом плане достаточно изощренно устроена, там не тупой троттлинг по всему чипу, а перераспределение нагрузки на более холодные, менее загруженные участки, с отключением всего, что в данный момент не нужно.

Khnazile ★★★★★ ()
Ответ на: комментарий от Khnazile

Она не переключается для экономии энергии в простое, но под нагрузкой во избежание перегрева все равно будет тормозить блоки. На сколько я понял, вега в этом плане достаточно изощренно устроена

Я слышал что у AMD в FX процессорах из-за нехватки напряжения в цепях питания могут наблюдаться тормоза, кажется признаком на FX было резкое падение скорости чтения/записи L3 кэша, лечилось повышением напряжения.
Может ТС тоже стоит не андервольт делать, а добавить напряжения? А еще понизить частоты, чтоб прямо с запасом :)

Aber ★★★★ ()
Последнее исправление: Aber (всего исправлений: 1)
Ответ на: комментарий от Aber

Может ТС тоже стоит не андервольт делать, а добавить напряжения? А еще понизить частоты, чтоб прямо с запасом :)

Может хватит чего либо одного?

torvn77 ★★★★★ ()

Мне заковать radeon vii в водоблок не сильно помогло, так что не факт что проблема именно с перегревом. Здесь дело, скорее всего, как высказывали предположение и в этом треде, и в обсуждении багов, в переключении на минимальные режимы энергопотребления. Возможно даже, что и на аппаратном уровне что-то есть. Но вообще попробуй, андервольтнуть, послежу за тредом

sehellion ★★★★★ ()
Ответ на: комментарий от anonymous

Один раз видел панику ядра, где-то в 2013. Ещё были краши иксов (один хрен пришлось ребут делать) и тиринг.

Meyer ★★★★★ ()
Ответ на: комментарий от Khnazile

Для понимания: 7нм вегу (aka Radeon VII) сняли с производство менее чем через 6 месяцев после релиза. Потому что даже сами АМД не верят в то, что остались люди, готовые это покупать. А следующую модификацию веги, Arcturus, вообще планируется поставлять исключительно ынтерпрайзу. Это все, что нужно знать о геймерских перспективах веги.

А на чём тогда собственно играют в стане «красных»?

intelfx ★★★★★ ()
Ответ на: комментарий от intelfx

А на чём тогда собственно играют в стане «красных»

На б/у полярисах по дешману. Это единственный более-менее выгодный вариант покупки видео красных на сегодня. В остальных случаях лучше брать у зеленых.

Да, под виндой у них ад с дровами не хуже, чем на линуксах, взять хотя бы злополучное декабрьское обновление.

Khnazile ★★★★★ ()
Ответ на: комментарий от Khnazile

На б/у полярисах по дешману.

Зачем б/у? Сейчас новые в магазинах, торгующих «серым» товаром, стоят сущие копейки.

Meyer ★★★★★ ()
Ответ на: комментарий от Meyer

Ну хз, по-моему они стоят примерно так же, как и близкие по производительности nvidia. Только к полярисам нужен более мощный блок питания, и если у тебя уже нет такого блока, то амд выйдет дороже.

Khnazile ★★★★★ ()
Ответ на: комментарий от Khnazile

Скорее даже дешевле, чем 1050 Ti или 1060 (в Москве).

Meyer ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.