LINUX.ORG.RU

OpenCL без X-Server

 , , ,


0

1

Есть ли истории успеха? У меня ситуация такая: вставил в PILOT штепсель ноутбука, а рядом с красной кнопкой выключения искрануло, и PILOT отключился. Предохранитель, видимо. Комп включается, но не показывает. Опытным путём выяснил что проблема в видеокарте. Пробовал HDMI и DVI (DisplayPort нечем), на DVI в режиме 640x480 можно увидеть кракозябры. Материнка самая дорогая, оверклокерская, на ней куча всяких там защит, поэтому ей ничего не было. Но на видеокарту идёт два кабеля дополнительного питания прямо с БП - наверное проблема в этом.

Решил запускать OpenCL вслепую, создал скрипт запуска через SSH, да не тут-то было: иксы тоже не стартуют (наверное не видит Screen, лог). А Catalyst, как известно, не позволяет запустить OpenCL с отключенным X-сервером. Как оказалось, я ошибался: в Catalyst 13.4 добавлена поддержка.

У меня установлен драйвер Catalyst 14.9. Пробую clinfo от root без иксов - пишет «Убито». От пользователя - видит только CPU, без GPU. Установил 14.4 - так же. «Может это в новых версиях сломали - это же ати... Установлю-ка я тот самый 13.4!». После перезагрузки меня ожидала неожиданная картина - иксы стартовали, хотя 13.4 не поддерживает xorg-server 1.15. Правда, загрузка CPU 100%, и процесс неубиваем (лог). Убрал иксы из «уровней запуска» перезагрузился. Стартую clinfo - тупо виснет. Попробовал Catalyst следующей стабильной версии - 13.9 - снова «Убито».

Кто-нибудь решал эту проблему? Поиск руководства дал статью Guide to run OpenCL headless, without X server and as normal user. Наложил патч - а он только на то чтобы clinfo видел GPU от юзера.

P.S. Ищу поиск ремонта видеокарт в Кемерово и Томске. Везде куда звонил чинят только ноутбуки.

Стоп. А почему ты думаешь, что сдохшая видеокарта должна продолжать работать с opencl?

intelfx ★★★★★ ()
Ответ на: комментарий от ZenitharChampion

Я уверен, что с шиной разговаривает не тот же самый чип, который занимается непосредственно вычислениями. А в логах вообще что? Каталист умеет выводить сообщения об аппаратных ошибках? (NB — у меня нет атишной карты.)

intelfx ★★★★★ ()
Последнее исправление: intelfx (всего исправлений: 1)

на nvidia блобе можно

anonymous ()
Ответ на: комментарий от intelfx

на видеокарте вообще один чип, не считая ram и vrm

anonymous ()

Попробовал пробросить видеокарту в Xen в Windows. Вставил NVIDIA и ATi в один системник. Внезапно выяснилось что проприетарный драйвер NVIDIA не умеет ядро Linux-xen, а только nv или nouveau. Ладно, пробьёмся.

ZenitharChampion ★★★★★ ()
Ответ на: комментарий от Novell-ch

Попробовал на открытых. Сначала в домашней системе, но выяснилось что с KMS загрузка виснет, а без KMS не загружается драйвер Radeon. Причём на каком-то старом ядре работало, но уже пофиг - я загрузил Fedora 21.

dmesg:

[    3.024201] nouveau  [     DRM] MM: using CRYPT for buffer copies
[    3.086556] nouveau  [     DRM] allocated 1920x1080 fb: 0x70000, bo ffff88023ea2f400
[    3.086682] fbcon: nouveaufb (fb0) is primary device
[    3.153584] Console: switching to colour frame buffer device 240x67
[    3.155491] nouveau 0000:01:00.0: fb0: nouveaufb frame buffer device
[    3.155492] nouveau 0000:01:00.0: registered panic notifier
[    3.158498] [drm] Initialized nouveau 1.2.0 20120801 for 0000:01:00.0 on minor 0
[    3.158704] [drm] initializing kernel modesetting (CYPRESS 0x1002:0x6899 0x174B:0xE140).
[    3.158714] [drm] register mmio base: 0xF7320000
[    3.158715] [drm] register mmio size: 131072
[    3.275712] ATOM BIOS: CYPRESS
[    3.275780] [drm] GPU not posted. posting now...
[    3.327117] radeon 0000:07:00.0: VRAM: 1024M 0x0000000000000000 - 0x000000003FFFFFFF (1024M used)
[    3.327119] radeon 0000:07:00.0: GTT: 1024M 0x0000000040000000 - 0x000000007FFFFFFF
[    3.327120] [drm] Detected VRAM RAM=1024M, BAR=256M
[    3.327121] [drm] RAM width 256bits DDR
[    3.327129] [drm] radeon: 1024M of VRAM memory ready
[    3.327130] [drm] radeon: 1024M of GTT memory ready.
[    3.327142] [drm] Loading CYPRESS Microcode
[    3.327205] [drm] Internal thermal controller with fan control
[    3.329172] [drm] radeon: dpm initialized
[    3.329264] [drm] GART: num cpu pages 262144, num gpu pages 262144
[    3.330461] [drm] enabling PCIE gen 2 link speeds, disable with radeon.pcie_gen2=0
[    3.331620] [drm] PCIE GART of 1024M enabled (table at 0x000000000025D000).
[    3.331705] radeon 0000:07:00.0: WB enabled
[    3.331708] radeon 0000:07:00.0: fence driver on ring 0 use gpu addr 0x0000000040000c00 and cpu addr 0xffff88023d31dc00
[    3.331709] radeon 0000:07:00.0: fence driver on ring 3 use gpu addr 0x0000000040000c0c and cpu addr 0xffff88023d31dc0c
[    3.333207] radeon 0000:07:00.0: fence driver on ring 5 use gpu addr 0x000000000005c418 and cpu addr 0xffffc9001109c418
[    3.333209] [drm] Supports vblank timestamp caching Rev 2 (21.10.2013).
[    3.333209] [drm] Driver supports precise vblank timestamp query.
[    3.333250] radeon 0000:07:00.0: irq 62 for MSI/MSI-X
[    3.333259] radeon 0000:07:00.0: radeon: using MSI.
[    3.333287] [drm] radeon: irq initialized.
[    3.349793] [drm] ring test on 0 succeeded in 1 usecs
[    3.349799] [drm] ring test on 3 succeeded in 3 usecs
[    3.546799] [drm] ring test on 5 succeeded in 1 usecs
[    3.546806] [drm] UVD initialized successfully.
[    3.546925] Switched to clocksource tsc
...
[   14.036398] radeon 0000:07:00.0: ring 0 stalled for more than 10000msec
[   14.036422] radeon 0000:07:00.0: GPU lockup (waiting for 0x0000000000000001 last fence id 0x0000000000000000 on ring 0)
[   14.036428] [drm:r600_ib_test] *ERROR* radeon: fence wait failed (-35).
[   14.036445] [drm:radeon_ib_ring_tests] *ERROR* radeon: failed testing IB on GFX ring (-35).
[   14.036460] [drm:radeon_device_init] *ERROR* ib ring test failed (-35).
[   14.037038] [drm] Radeon Display Connectors
[   14.037040] [drm] Connector 0:
[   14.037040] [drm]   DP-1
[   14.037041] [drm]   HPD4
[   14.037043] [drm]   DDC: 0x6430 0x6430 0x6434 0x6434 0x6438 0x6438 0x643c 0x643c
[   14.037043] [drm]   Encoders:
[   14.037044] [drm]     DFP1: INTERNAL_UNIPHY2
[   14.037045] [drm] Connector 1:
[   14.037046] [drm]   HDMI-A-2
[   14.037046] [drm]   HPD5
[   14.037047] [drm]   DDC: 0x6460 0x6460 0x6464 0x6464 0x6468 0x6468 0x646c 0x646c
[   14.037048] [drm]   Encoders:
[   14.037049] [drm]     DFP2: INTERNAL_UNIPHY2
[   14.037049] [drm] Connector 2:
[   14.037050] [drm]   DVI-I-2
[   14.037051] [drm]   HPD1
[   14.037052] [drm]   DDC: 0x6450 0x6450 0x6454 0x6454 0x6458 0x6458 0x645c 0x645c
[   14.037052] [drm]   Encoders:
[   14.037053] [drm]     DFP3: INTERNAL_UNIPHY1
[   14.037054] [drm]     CRT2: INTERNAL_KLDSCP_DAC2
[   14.037054] [drm] Connector 3:
[   14.037055] [drm]   DVI-I-3
[   14.037056] [drm]   HPD6
[   14.037057] [drm]   DDC: 0x6470 0x6470 0x6474 0x6474 0x6478 0x6478 0x647c 0x647c
[   14.037057] [drm]   Encoders:
[   14.037058] [drm]     DFP4: INTERNAL_UNIPHY
[   14.037059] [drm]     CRT1: INTERNAL_KLDSCP_DAC1
[   14.095622] radeon 0000:07:00.0: No connectors reported connected with modes
[   14.095626] [drm] Cannot find any crtc or sizes - going 1024x768
[   14.096729] [drm] fb mappable at 0xB045E000
[   14.096730] [drm] vram apper at 0xB0000000
[   14.096731] [drm] size 3145728
[   14.096732] [drm] fb depth is 24
[   14.096733] [drm]    pitch is 4096
[   14.096801] radeon 0000:07:00.0: fb1: radeondrmfb frame buffer device
[   14.096825] [drm] Initialized radeon 2.40.0 20080528 for 0000:07:00.0 on minor 1

Как видно, через попу, но модуль загружен и работает:

sudo lspci -v

07:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Cypress PRO [Radeon HD 5850] (prog-if 00 [VGA controller])
	Subsystem: PC Partner Limited / Sapphire Technology Device e140
	Flags: bus master, fast devsel, latency 0, IRQ 62
	Memory at b0000000 (64-bit, prefetchable) [size=256M]
	Memory at f7320000 (64-bit, non-prefetchable) [size=128K]
	I/O ports at b000 [size=256]
	Expansion ROM at f7300000 [disabled] [size=128K]
	Capabilities: [50] Power Management version 3
	Capabilities: [58] Express Legacy Endpoint, MSI 00
	Capabilities: [a0] MSI: Enable+ Count=1/1 Maskable- 64bit+
	Capabilities: [100] Vendor Specific Information: ID=0001 Rev=1 Len=010 <?>
	Capabilities: [150] Advanced Error Reporting
	Kernel driver in use: radeon
	Kernel modules: radeon

clinfo увидел карточку, написал её модель, показал количество мегагерц. У меня не было сомнений - это она. Я очень обрадовался, у меня появилась надежда.

Собрал cgminer 3.7.2 и bfgminer 4.10.

Многообещающее начало

Через несколько секунд экран начинает заполняться большим количеством таких сообщений

Мой ответ будет состоять из трёх частей: открытый, закрытый драйверы, и в винде. Винду планирую попробовать через проброс видеокарты в виртуальную машину Xen, а может быть настоящую, ещё не знаю. У меня с этим пока проблемы. А закрытый драйвер уже опробован, и всё печально. Похоже, видеокарта умерла.

ZenitharChampion ★★★★★ ()
Последнее исправление: ZenitharChampion (всего исправлений: 2)

Карточка заработала. Fedora 21 не смогла, Opensuse 12.2 не смог, а Opensuse 12.1 смог! Не знаю почему, но с ним всё работает! Это происходит так: BIOS не отрисовывается, GRUB 1 не отрисовывается, а в процессе загрузки initrd всё появилось! Потом врубается KMS - и всё в HiRES! Напомню, карточка вела себя, как мёртвая, со ВСЕМИ системами.

Установил Catalyst 15.9, с ним тоже отрисовывается - но так как nomodeset, в 640x480. clinfo выдаёт Kernel Oops, пнятно. Иксы тоже не стартуют. А вот открытый драйвер вполне себе рисует иксы... Блин! Я год не пользовался карточкой, которая работала!

Щас компилячу Clover. Он потребовал GCC 4.7, который кто-то заботливо компильнул под эту версию ОС: http://download.opensuse.org/repositories/home:/plater/openSUSE_12.1/ Щас докомпиляю LLVM из Pontostroy (компиляется целую вечность), затем наконец узнаю - работает ли OpenCL?

ZenitharChampion ★★★★★ ()
Последнее исправление: ZenitharChampion (всего исправлений: 2)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.