LINUX.ORG.RU

Смена видеокарты

 , , ,


0

1

Всем привет. На днях поменял видеокарту с 1050 ti на 3080 и БП, и столкнулся с проблемой, что рандомно появляется черный экран и система как-будто пытается уйти в ребут, но в ребут по итогу не уходит и намертво зависает. При этом отключается часть usb портов (клавиатура, мышь). В первый раз такую проблему словил при обновлении пакетов, после стабильно система начала зависать при работе в IDE. Ставил назад 1050 ti и никаких проблем нет. Из под винды похожих проблем не наблюдаю. Грешил на БП, но гонял в винде стресс тесты - все в порядке. Такое ощущение, что в системе где-то остались упоминания на старую видеокарту. Пробовал: грузился через wayland, искал упоминание карточки в /etc/X11/, убирал параметр nvidia-drm.modeset=1, гонял glmark2 (при прогонах черного экрана не было), полностью сносил xorg, nvidia, nvidia-utils и ставил заново - результатов не дало. В логах иксов ничего путного не нашел, как и в dmesg -l err,crit -H, и в journalctl по времени перед последующей загрузкой тоже нет ошибок. Дистрибутив: arch, de: gnome, ядро: 5.17.1-arch1-1, версия пакета nvidia: 510.60.02-11

Возможно, что у кого-то будут идеи, куда еще можно покопать и как можно решить проблему без переустановки ОС. Заранее спасибо.



Последнее исправление: Sontkjof (всего исправлений: 2)

Ответ на: комментарий от Sontkjof

Затрудняюсь сказать, куда копать в этом случае.

Т.е. при загрузке нет информации касательно видеокарты вообще? Ненормально же. Без грепа результаты есть? Или в самом /var/log/dmesg посмотреть.

PhysShell ★★
()
Ответ на: комментарий от PhysShell

Сделал сейчас ребут, записи появились

[    3.369544] input: HDA NVidia HDMI/DP,pcm=3 as /devices/pci0000:00/0000:00:03.1/0000:0a:00.1/sound/card1/input15
[    3.392426] input: HDA NVidia HDMI/DP,pcm=7 as /devices/pci0000:00/0000:00:03.1/0000:0a:00.1/sound/card1/input16
[    3.392488] input: HDA NVidia HDMI/DP,pcm=8 as /devices/pci0000:00/0000:00:03.1/0000:0a:00.1/sound/card1/input17
[    3.392530] input: HDA NVidia HDMI/DP,pcm=9 as /devices/pci0000:00/0000:00:03.1/0000:0a:00.1/sound/card1/input18
[    3.392562] input: HDA NVidia HDMI/DP,pcm=10 as /devices/pci0000:00/0000:00:03.1/0000:0a:00.1/sound/card1/input19
[    3.392592] input: HDA NVidia HDMI/DP,pcm=11 as /devices/pci0000:00/0000:00:03.1/0000:0a:00.1/sound/card1/input20
[    3.392617] input: HDA NVidia HDMI/DP,pcm=12 as /devices/pci0000:00/0000:00:03.1/0000:0a:00.1/sound/card1/input21
[    3.684791] nvidia: loading out-of-tree module taints kernel.
[    3.684803] nvidia: module license 'NVIDIA' taints kernel.
[    3.715705] nvidia: module verification failed: signature and/or required key missing - tainting kernel
[    3.834141] nvidia-nvlink: Nvlink Core is being initialized, major device number 511
[    3.835072] nvidia 0000:0a:00.0: vgaarb: changed VGA decodes: olddecodes=io+mem,decodes=none:owns=io+mem
[    3.878508] NVRM: loading NVIDIA UNIX x86_64 Kernel Module  510.60.02  Wed Mar 16 11:24:05 UTC 2022
[    4.142720] nvidia_uvm: module uses symbols from proprietary module nvidia, inheriting taint.
[    4.147839] nvidia-modeset: Loading NVIDIA Kernel Mode Setting Driver for UNIX platforms  510.60.02  Wed Mar 16 11:17:28 UTC 2022
[    4.158082] nvidia-uvm: Loaded the UVM driver, major device number 509.
[    4.296642] [drm] [nvidia-drm] [GPU ID 0x00000a00] Loading driver
[    4.296649] [drm] Initialized nvidia-drm 0.0.0 20160202 for 0000:0a:00.0 on minor 0
[    5.947126] caller _nv000651rm+0x1ad/0x200 [nvidia] mapping multiple BARs
Sontkjof
() автор топика
Ответ на: комментарий от Sontkjof

Вчера не то спросил. Хотел проверить на gpu has fallen off the bus, но попросил загрузочные логи.

Нужно то, что пишется при уходе в астрал. Как вариант, можно начать писать в файл: dmesg -w > mydmesg.log, потом открыть IDE, повиснуть, и после ребута глянуть последние строки файла.

PhysShell ★★
()
Ответ на: комментарий от PhysShell

Виновник зависаний по итогу нашелся - процессор. Вчера на ночь еще поставил прогон linpack’ом, на утро точно такой же симптом, что компьютер как будто завис в ребуте. Потом вспомнил, что проц гнал и скинул разгон. За день работы ни разу не вылетало похожих зависаний. После работы попробовал подобрать новое напряжение, как итог после двух часов прогона тем же linpack’ом проблема не повторилась. Видимо после замены БП не подходило прошлое подобранное напряжение на проц, других вариантов я не вижу. Почему со старой видеокартой, со старым напряжением на проц и новым БП линукс не зависал - остается загадкой.

Спасибо за помощь.

Sontkjof
() автор топика
Последнее исправление: Sontkjof (всего исправлений: 1)
Ответ на: комментарий от Sontkjof

Почему со старой видеокартой, со старым напряжением на проц и новым БП линукс не зависал - остается загадкой.

Старый бп стабильнее держал ток или напругу под старой пиковой нагрузкой, ваш кэп (с)

rukez ★★★★
()
Ответ на: комментарий от Sontkjof

Вообще не подумал бы. Зависание на мой, не обременённый опытом взгляд, как-то совсем нехарактерно для железопроблем.

Спасибо, что отписался – полезно было узнать.

PhysShell ★★
()
Ответ на: комментарий от rukez

Но я пробовал ставить же старую видеокарту, когда стоял новый БП (до этого был seasonic s12ii на 512 ватт, сейчас стоит corsair RM1000x 2021) и была старая напруга на проц - все было в порядке. Или ты имеешь в виду, что достаточно поставить ту же видеокарту, но более жирную и есть вероятность, что в нагрузке или даже в простое не подойдет ранее подобранное напряжение на проц ?

Sontkjof
() автор топика
Последнее исправление: Sontkjof (всего исправлений: 2)
Ответ на: комментарий от Sontkjof

Или ты имеешь в виду, что достаточно поставить ту же видеокарту, но более жирную и есть вероятность, что в нагрузке или даже в простое не подойдет ранее подобранное напряжение на проц ?

Йа йа, твоя 1050 лопает 75-100Вт, 3080 - 350-400Вт.
Для 12 Вольтовой шины разница в токах соотв 6-8 и 30+.
Насколько просаживается напруга при нагрузке в 30 Ампер сильно зависит от блока, проводов, разъёмом. В штатном режиме у тебя врм процессора вытягивает преобразование из проседающих с 12 до условных 11.8 Вольт до нужных условных 1.8, при разгоне ты перегружаешь врм и он в какой-то момент при 11.8 на входе делает 1.7 и твой разогнанный проц, работающий в нештатном режиме, делает ёк.
П.с. Цифры условные

rukez ★★★★
()