LINUX.ORG.RU

Nvidia 79, GPU has fallen off the bus

 ,


0

1

Всем привет. Неделю назад я установил Fedora 39. При установке были зависания, поэтому я установил через режим с «basic» графическим драйвером. Потом из rpm fusion установил старые драйвера для nvidia, потому, что старая видеокарта Nvidia 550Ti.

rpm -qa |grep nvidia
xorg-x11-drv-nvidia-390xx-kmodsrc-390.157-3.fc39.x86_64
nvidia-settings-390xx-390.157-2.fc39.x86_64
xorg-x11-drv-nvidia-390xx-libs-390.157-3.fc39.x86_64
xorg-x11-drv-nvidia-390xx-390.157-3.fc39.x86_64
akmod-nvidia-390xx-390.157-6.fc39.x86_64
kmod-nvidia-390xx-6.7.6-200.fc39.x86_64-390.157-6.fc39.x86_64
kmod-nvidia-390xx-6.7.7-200.fc39.x86_64-390.157-6.fc39.x86_64
nvidia-gpu-firmware-20240220-1.fc39.noarch

После один раз завис Libreoffice. Затем, пока я искал возможность , чтобы заработала веб-камера Линукс работал без проблем неделю! Fedora 39 не видит веб-камеру Logitech Brio 4K Сегодня начались постоянные зависания. Зависает без нагрузки, просто открываю LibreOffice или GoogleChrome и зависает. При этом можно зайти по Ssh. На 100% работает процесс Xorg. Он не убивается, даже с kill -9. Если комп удаленно перегрузить через «shutdown -r now» комп не перегружается, только пропадает доступ через ssh.

Вывод dmesg:

NVRM: GPU at PCI:0000:01:00: GPU-656da171-d6ad-eaf8-9320-1448da66dea7
[  +0,000008] NVRM: Xid (PCI:0000:01:00): 79, GPU has fallen off the bus.
[  +0,000001] NVRM: GPU at 0000:01:00.0 has fallen off the bus.
[  +0,000011] NVRM: A GPU crash dump has been created. If possible, please run
              NVRM: nvidia-bug-report.sh as root to collect this data before
              NVRM: the NVIDIA kernel module is unloaded.

Я бы подумал, что это аппаратная проблема видеокарты, НО fedora целую неделю не зависала. В Windows проблем нет. И главное зависает только под одним пользователем (моего сына без прав sudo) и только из програм Libreoffice и Google Chrome.Из под Firefox не зависает. Также не зависает под другим пользователем(тоже без sudo), Я пробовал сидеть под собой…

В теме про веб камеру, которая не работает на USB 3.0 разъёме было предположение, что проблема с энергосбережением. Я нагуглил, что падение nvidia может быть из-за нехватки питания. В gnome я выставил режим энергосбережения «Производительный», но это не помогло. Также Я обновил полностью Fedora через dnf update. Есть какие-то предположения? Кроме аппаратной проблемы видеокарты?



Последнее исправление: user2021 (всего исправлений: 2)

Ты используешь на системе со свежим X11 сервером драйвер, что уже год с лишним не поддерживается официально, и кое-как перепаковывается энтузиастами. При этом код драйвера закрыт, так что патчей на 100% не будет.

Действительно, с чего это у тебя глюки?

Сиди на LTS дистрибутивах, например этот драйвер официально есть в Ubuntu 22.04 и в Debian 11:

Если будешь ставить Ubuntu, сделай позже sudo apt install linux-generic, перезагрузись на LTS ядро и удали новые, а то там из коробки HWE ядро, что слишком новое для такого драйвера. X11 бы лучше тоже даунгрейднуть, но тут не подскажу. С 20.04 HWE ядро и X11 в Ubuntu по умолчанию.

В Debian такого нет, но в 11 версии ещё есть подводные камни с дровами, описывал: Установка и настройка Debian 11 для десктопа с netinstall (незавершенная заметка) — зато в Ubuntu есть расширенная поддержка, теперь уже и universe multiverse: Использование Ubuntu Pro: разбираем на примере 16.04 Desktop

Если хочешь все же RHEL-подобные, то используй клоны 8 и 9 версий, в обоих есть этот драйвер. Лучше наверное 8, драйвер поддерживается неофициально, уже были случаи, что после обновлений X11 отваливались.

Vsevolod-linuxoid ★★★★★
()
Последнее исправление: Vsevolod-linuxoid (всего исправлений: 2)
Ответ на: комментарий от Vsevolod-linuxoid

Ты используешь на системе со свежим X11 сервером драйвер, что уже год с лишним не поддерживается официально

Т.е. если я установлю Fedora 37, которая вышла в ноябре 2022, проблем быть не должно?

user2021
() автор топика
Ответ на: комментарий от user2021

Не считая того факта, что это EOL, в котором с каждым днем все больше и больше известных незакрытых дыр.

Я сказал использовать LTS, дистрибутивы со старыми ядрами и X11, что получают обновления безопасности, а не EOL, которые уже вообще не поддерживаются.

Vsevolod-linuxoid ★★★★★
()
Ответ на: комментарий от xDShot

А LiveUSB Fedora загрузочная флешка, разве не на Nouveau работает? Чтобы у меня не зависала система, пришлось в режиме basic graphics устанавливать, а потом к ядру nomodeset параметр применять.

Мне сейчас в голову пришло, а не может быть, что у меня банально мощности блока питания не хватает? Usb 3.0 камера не запустилась в Линуксе(запустилась только в Usb 2.0), и зависание видеокарты, причем не постоянные. Хотя в windows же работает, да и видеокарту я ничем не нагружаю

user2021
() автор топика
Ответ на: комментарий от user2021

Live на nouveau работает. Ну неудачное у тебя железо, что поделать — старые nVidia хорошо работают только на LTS дистрибутивах Linux, с теми версиями ядер и X11, что вышли до конца их поддержки.

Vsevolod-linuxoid ★★★★★
()

«GPU has fallen off the bus» это всё ж на 90% аппаратная проблема. Это означает что устройство перестало вообще отвечать по PCIe (и как правило сопровождается тем что в lspci -v про устройсво видеокарты начинает показывать какую-то ерунду.

Если картинка при этом не исчезает, а просто замирает (я так понял из поста) - то сильнее всего похоже на то что питание в норме, но по какой-то причине исчезает связь между процессором и видеокартой по PCIe.

Если это чаще происходит назапуске определённой программы - может быть она даёт повышенную передачу данных по PCIe.

Что стоит попробовать для решения проблемы, в предположении что она аппаратная:

  • Вынуть-вставить карту из слота. Может плохой конткат стал
  • Попробовать вставить в другой слот, если он есть.
  • Принудительно попробовать ограничить скорость-версию шины PCIe до 1.0 в настройках BIOS, чтоб снизить требования к линиям передачи данных
  • Заклеить скотчем на разъёме карты все контакты кроме тех что соотвествуют x1, чтоб устройство стало PCIe x1 вместо PCIe x16. Если проблема в одной из следующих 15 линий - то проблема уйдёт. x1 это 11+7 линий, x16 это 11+71 - то есть заклеиваем последнии 64 линии, ориентируясб на википедию
  • Если другого слота нет - то может смысл перевставить процессор в сокет, так как потенциальные линии PCIe проходят и там

P.S.

  • Все вышеперичисленные варианты проверял лично и приводило к успеху хотя бы 1 раз
  • Будет ли карта тормозить если из x16 2.0 сделать x1 1.0? Там же пропускная спосоьность шины упадёт в 32 раза, паника!! Там остаётся 250МБайт/сек чего для примитивного рендеринга достаточно. Заметно тормозить начинают приложения захвата экрана и прогрузка сцен/локаций в играх.
  • Если вам не нравится вариант со скотчем - просто возьмите x1 майнинговый райзер PCIe, он ведь у вас под рукой также как и скотч. Им тоже можно ограничить ширину шины с 16 до 1.
  • Чтоб не напортачить необратимо - нужен хотя бы базовый опыт и понимание по сборке компов
GPFault ★★
()

Емнип ускорение надо отключить в LO и у хрома. Как именно отключается уже не помню, но было очень похожее поведение пару лет назад, сейчас у меня и дистр и карта другие

anonymous
()
Ответ на: комментарий от anonymous

В дрова не заложено возможности сделать так чтоб исчезло PCIe-устройство. Предполагаю что они сильнее или менее равномерно грузят шину PCIe чем винда, вот оно и отваливается

GPFault ★★
()
Последнее исправление: GPFault (всего исправлений: 1)

Всем спасибо за советы! Проблема оказалась аппаратной. Что помогло не знаю, но комп работает 3 дня и не виснет. Я пропылесосил системный блок, отключил от питания дополнительный SATA HDD и привод DVD. Видеокарту побоялся вынимать, видимо чем-то nvidia права, раз перестали выпускать обновление драйверов для видеокарт, которым больше 10 лет. Я пытался отключить дополнительное питание, но там пластик каменный стал, того и гляди рассыпится. Кабеля все жёсткие, еле гнутся. Я просто прижал в пазы видеокарту, но она плотно вставлена была. Печально конечно, что в винде комп работал, а в Линукс умирал. Раньше было всегда наоборот Линукс работал безотказно, а у винды чуть что синий экран.

user2021
() автор топика
Последнее исправление: user2021 (всего исправлений: 2)