LINUX.ORG.RU

Видеокарта XFX BC-160

 , ,


0

2

Приобрёл для экспериментов майнер-видеокарту XFX BC-160 8 GB (она же AMD Radeon Pro V520) NAVI12. Цель была использовать её в связке через MULTIGPU встроенной в процессор VEGA. А так же возможность использовать OpenCL через ROCm.

И так - что сразу пошло не так. При загрузке модуля ядра amdgpu она начинает работать и в общем всё хорошо - в системе всё видно, объём памяти, датчики и т.д. Но как только идёт обращение приложения через DRI_PRIME=1 к видеопроцессору, то ядро выдаёт ошибки и приложение «крашится». Пробовал множество параметров ядра найденных в интернете. Так же перебирал различные доступные прошивки bios как от XFX, так и от AMD. Так же пробовал ставить amdgpu-pro драйвер с сайта AMD. Испробованные ядра - от 6.14.X - до 7.0.X Результат отрицательный.

Пару раз, всё же система запустилась без ошибок и даже удалось прогнать Unigine Superposition и Metro Exodus через Proton. Производительность очень приятно удивила. Но 90% случаях инициализация карты заканчивается на этом:

мая 07 23:20:42 pc kernel: amdgpu 0000:03:00.0: [drm] *ERROR* IB test timed out
мая 07 23:20:42 pc kernel: amdgpu 0000:03:00.0: [drm:amdgpu_ib_ring_tests [amdgpu]] *ERROR* IB test failed on sdma0 (-110).
мая 07 23:20:43 pc kernel: amdgpu 0000:03:00.0: [drm] *ERROR* IB test timed out
мая 07 23:20:43 pc kernel: amdgpu 0000:03:00.0: [drm:amdgpu_ib_ring_tests [amdgpu]] *ERROR* IB test failed on sdma1 (-110).
мая 07 23:20:43 pc kernel: amdgpu 0000:03:00.0: ib ring test failed (-110).
мая 07 23:20:43 pc kernel: BUG: kernel NULL pointer dereference, address: 0000000000000000
мая 07 23:20:43 pc kernel: #PF: supervisor read access in kernel mode
мая 07 23:20:43 pc kernel: #PF: error_code(0x0000) — not-present page
мая 07 23:20:43 pc kernel: BUG: kernel NULL pointer dereference, address: 0000000000000000
мая 07 23:20:43 pc kernel: #PF: supervisor read access in kernel mode
мая 07 23:20:43 pc kernel: #PF: error_code(0x0000) — not-present page

В системе присутствуют firmware от данного чипа NAVI12, в том числе отвечающие за технологию SDMA (System DMA в драйвере amdgpu — это многоцелевой движок прямого доступа к памяти, предназначенный для эффективного копирования данных между системной памятью (RAM) и видеопамятью (VRAM). Он оптимизирован для высокой пропускной способности (например, PCIe 4.0 x16, до 32 ГБ/с), разгружая центральный процессор и графические ядра при работе с памятью.):

[user@pc ~]$ ls /lib/firmware/amdgpu/ | grep navi12
navi12_asd.bin.xz
navi12_ce.bin.xz
navi12_dmcu.bin.xz
navi12_gpu_info.bin.xz
navi12_me.bin.xz
navi12_mec2.bin.xz
navi12_mec.bin.xz
navi12_pfp.bin.xz
navi12_rlc.bin.xz
navi12_sdma1.bin.xz
navi12_sdma.bin.xz
navi12_smc.bin.xz
navi12_sos.bin.xz
navi12_ta.bin.xz
navi12_vcn.bin.xz

Если есть у кого опыт использования данных «видеокарт» в быту, прошу поделится )



Последнее исправление: delidov_george (всего исправлений: 1)

Вдобавок скажу что видеоускорение на картах мертво полностью, libva отказывает, VCN/UVD/VCE блоки отсутствуют, так что необходимо указывать софтварное видеоускорение для корректной работы

RADV_PERFTEST=video_decode,video_encode
Shipa_2
()
Ответ на: комментарий от Shipa_2

Завтра попробую ваши версии, может там действительно что-нибудь поправлено в отличии от стока.

delidov_george
() автор топика
Ответ на: комментарий от Shipa_2

Карта переодически сыпет у меня ошибку в режиму дуал гпу с картой r9 280x она стоит

Jun 02 11:45:23 cachyos-x8664 kernel: amdgpu 0000:05:00.0: device lost from bus! Jun 02 11:45:23 cachyos-x8664 kernel: amdgpu 0000:05:00.0: SMU: bus error for message: DisallowGfxOff(42) response:0xFFFFFFFF Jun 02 11:45:23 cachyos-x8664 kernel: in params:00000000 Jun 02 11:45:23 cachyos-x8664 kernel: amdgpu 0000:05:00.0: Failed to disable gfxoff! Jun 02 11:45:23 cachyos-x8664 kernel: amdgpu 0000:05:00.0: device lost from bus! Jun 02 11:45:23 cachyos-x8664 kernel: amdgpu 0000:05:00.0: SMU: bus error for message: GetEnabledSmuFeaturesHigh(13) response:0xFFFFFFFF Jun 02 11:45:23 cachyos-x8664 kernel: in params:00000000 Jun 02 11:45:23 cachyos-x8664 kernel: amdgpu 0000:05:00.0: Failed to retrieve enabled ppfeatures! Jun 02 11:45:23 cachyos-x8664 kernel: amdgpu 0000:05:00.0: device lost from bus! Jun 02 11:45:23 cachyos-x8664 kernel: amdgpu 0000:05:00.0: SMU: bus error for message: GetEnabledSmuFeaturesHigh(13) response:0xFFFFFFFF

и вот такаяя ошибка.

foma_na
()

Пришла ещё одна видеокарта от ещё одного (третьего) продавца с Авито. Она оказалась разлоченая до 175Вт.

Вот её VBIOS:

Adapter  0    SEG=0000, BN=03, DN=00, PCIID=73601002, SSID=0A341002)
    Asic Family        :  Navi12         
    Flash Type         :  GD25Q80C    (1024 KB)
    Product Name       :  NAVI12 A0 GLXLB D30503 8GB BC160 1150e/334m HYN/SAM 
    Bios Config File   :  AB574625.bin   
    Bios P/N           :  113-D3050301-X00
    Bios Version       :  017.003.000.008.017114
    Bios Date          :  07/27/21 08:30 
    ROM Image Type     :  Hybrid Images
    ROM Image Details  :  
        Image[0]: Size(58368 Bytes), Type(Legacy Image)
        Image[1]: Size(44544 Bytes), Type(EFI Image)

https://delidov.ru/files/bc-160/XFX_BC-160_113-D3050301-X00_017.003.000.008.017114_2021-07-27-08-33.rom

delidov_george
() автор топика
Ответ на: комментарий от Shipa_2

В общем прошивка vbios1.rom та же что и попалась мне выше XFX_BC-160_113-D3050301-X00_017.003.000.008.017114_2021-07-27-08-33.rom и она интересней чем vbios2.rom (которая является стоковой и шла в моих первых купленных bc-160 на заводских пломбах XFX). А вот последняя bc-160 была на самопальной пломбе и вот с такой модификацией VBIOS.

Интересней тем, что снято ограничение 100W, максимальная частота GPU 1650МГц, но частота памяти на 200МГц ниже - 1000МГц, но за то не скидывает частоту, а стабильно держит на 1000МГц. Отличная прошивка для тех, кто не хочет заморачиваться с разгоном.

delidov_george
() автор топика
Последнее исправление: delidov_george (всего исправлений: 2)
Ответ на: комментарий от delidov_george

что то подсказывает мне что разгоны бесполезны на этой карте, прирост очень маленький, а греться будет довольно таки больше.

думаю турбину убрать, поставить 2 кулька 80мм на радиатор(немного будет обдувать зону где теплотрубка). подключал кулёк, сигнал pwm ловит, обороты регулируются, вот думаю что делать с загнутыми лопастями радиатора, загнуть внутрь дабы каналы обдува появились или вообще откусить, до этого думал кожух 3d сделать и печать заказать(куллер на вход и выход) по размеру старого кожуха.

blanco
()
Ответ на: комментарий от blanco

Разогонял так:

GPU: 1800MHz / 1080mv RAM: 1000MHz

Прирост в SuperPosition (1080p high) приблизительно на +1500 очков. Ну да может и не большой прирост.

При этом потребление не больше 150Вт. Нагрев не более 71C при моей кривой вентилятора (баланс около 50% для тихой работы).

Ну тое-сть андервольтинг помогает избавится от нагрева, но не все чипы смогут. У меня стартанул на такой частоте чип только от 1030mv.

delidov_george
() автор топика
Последнее исправление: delidov_george (всего исправлений: 3)
  • Markdown
Пустая строка (два раза Enter) начинает новый абзац. Знак '>' в начале абзаца выделяет абзац курсивом цитирования.
Внимание: прочитайте описание разметки Markdown.
Используйте Ctrl-Enter для размещения комментария