LINUX.ORG.RU

Уход в ребут при использовании граф. установщика

 


0

1

Доброго времени суток!

Конфигурация:

  • процессор Ryzen 5 3600x
  • видеокарта Nvidia rtx 2080s
  • мат.плата Msi mpg x570 gaming plus (ms-7c37)

К своему несчастью при попытке установить и пользоваться хотя бы одним из интересных мне дистрибутивов (Void, Arch, Fedora, Nix), каждый раз ловлю странное поведение моей системы.

Каждый раз при попытке установить одну из осей в графическом режиме, в случайный момент, компьютер начинает фризить сильнее и сильнее с каждой секундой пока он полностью не зависнет и самостоятельно не отправится в ребут. Данная проблема также возникает и в уже установленных системах посредством терминала.

Говоря о случайности возникновения подобного, имею ввиду, что проблема может возникнуть и через 10 секунд и через час. Долго думал на видеокарту и драйвера, ставил как проприетарные так и открытые, также проблема не пропала, когда поменял видеокарту на красных (rx 580), обновление биос также никак не помогло.

Прошу помочь форумчан, или хотя бы дать наставление на дальнейшее изучение, потому что единственно работающая ось в лице windows уже достала :(

Исходя из написанного можно предположить, что проблема аппаратная, перегрев процессора, перегрев чипсета материнской платы, проблема в подключении SATA диска (SATA SSD / SATA HDD), проблема с ними самими, либо дефект в процессоре / материнской плате.

На youtube в каналах по ремонту компьютерной техники не встречался с видео где рассказывали о сбойных AMD Ryzen, которые после перегрева теряли стабильность - повреждались внутренние структуры процессора, переставали работать стабильно некоторые ядра процессора.

Хотя бы вот:

Были и другие видео на этом канале с проблемой, когда подбитый процессор приводил к нестабильной работе системы. Т.е. даже ОС то загружается, то нет, а после замены процессора или отключения части ядер процессора всё работает стабильно.

Можешь ещё биос обновить.

Можно попробовать отключить часть ядер процессора, если данная функция есть в BIOS (UEFI) материнской платы для диагностики проблемы, ну либо так использовать.

Если подтвердится - меняй процессора.

Может нехватка по питанию, слабый и старый блок питания.

У тебя проблема сбойной аппаратной части.

Проверяй всё написанное, если переподключение комплектующих, устранение перегрева, замена блока питания не поможет - скорее всего, дело в процессоре.

Как бы печально это ни звучало. И я думаю, что у тебя проблема именно с процессором. Хотя может быть и сбойная оперативная память, надеюсь ты не поставил себе память от AMD, их оперативная память выпускается с отбракованными чипами, которые не прошли проверку для отправки другим именитым производителям.

У меня самого Ryzen 5 3600 просто, пока проблем нет.

anonymous
()
Ответ на: комментарий от anonymous

Ещё может быть проблема в NVME накопителе, у меня самого плата MSI x470 gaming plus max, брал т.к. много фаз питания процессора и охлаждение хорошее и на ней как минимум два m2 nvme разъёма, может быть даже 3.

Поставил два nvme накопителя на 256 Гб и 1024 Гб. Оба от A-Data. Не смог до конца победить проблему, от старта к старту ПК система то видит, то не видит NVME накопитель в одном из m2 nvme разъёмов.

В итоге отключил из нижнего nvme разъёма nvme накопитель на 256 Гб.

Система стабильно работает. На лицо проблема совместимости комплектующих. Хотя даже выходили обновления BIOS с исправлением проблемы NVME, т.к. было написано в описании к BIOS.

Что делать.

anonymous
()

Осталось поменять проц с материнкой.

Запусти в консоли top, поставь его на видное место и не закрывай другими окнами, и может быть увидишь там причину проблем когда начнёт лагать.

И ещё одноу окно, в нём зайти за рута и запусти dmesg -TW - тоже может что-то заметно будет во время проблем.

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 1)
Ответ на: комментарий от anonymous

Ну я могу с уверенностью сказать что это не проблема процессора или блока питания, да и оперативы в общем тоже, потому что на винде конфигурация работает стабильно, стресс тесты гонит, игры играет. Биос тоже обновлял, до этого была версия 2020 года, сейчас свежачек, 12 апреля только вышла.

nya_desu
() автор топика
Ответ на: комментарий от anonymous

У меня два диска, 980 на 500гб как nvme (на нём винда), второй на тб 970 как SATA, к кристал диске их гнал всё хорошо, работают оба исправно не первый год, но опять из под винды

nya_desu
() автор топика
Ответ на: комментарий от nya_desu

Всё может быть. Показатель, что на windows у тебя нет падений - не показатель. Может быть там не задействуются все ядра в том наборе приложений, что ты используешь.

Повторюсь, достоверно можно узнать - заменой процессора или попробовать отключать ядра в BIOS и смотреть помогло или нет.

А так, собирай и показывай логи. Где хотя бы один лог?

Что в выводе journalclt -xe? Где содержимое журналов dmesg, в прошлых файлах что-то должно быть.

Это твоё дело свято верить, что проблемы с железом нет.

Как ты ставил драйверы на видео карту? В целом, всё же думаю, что проблема аппаратная. Почему не проявляется в Windows - не знаю.

Возможно проблема в поддержке ядром Linux какой-нибудь железки. А для этого нужно смотреть логи.

Попробуй добавить к параметрам ядра panic=30, допустим и настрой вывод сообщения ядра прямо в консоль. Может быть увидишь сообщения ядра о том почему оно падает.

anonymous
()
Ответ на: комментарий от nya_desu

к кристал диске их гнал всё хорошо, работают оба исправно не первый год, но опять из под винды

SSD это такая вещь, что может показывать своё здоровье 100%, а через пару секунд заблокироваться. Crystal Disk и SMART ничего не показывают. Это вообще не показатель. Больше покажут утилиты производителя накопителя, да и то, не те, что на сайте в разделе тех. поддержка, а сервисные, но их ещё найди.

anonymous
()
Ответ на: комментарий от nya_desu

Круто, но всё-таки сделай окно с top и ещё окно с dmesg -TW всегда видимые на экране.

Что такое «нагрузка падает до нуля» я не знаю, у top показывается много разных показателей, как в общей шапке, так и в описаниях процессов.

firkax ★★★★★
()
Ответ на: комментарий от nya_desu

Что в логах-то? То, что ты видишь в графике, в том числе в системном мониторе в DE - ровным счётом ничего не говорит. Нужно смотреть сообщения ядра Linux.

Для этого добавь параметр panic=30, по умолчанию он 0, в нём указывается через сколько секунд при кернел паник отправить систему в reboot. И настрой вывод сообщений ядра в консоль. Может быть успеешь что-нибудь увидеть, по крайней мере логи могу успеть записаться.

А дальше после такого падения - заливай на pastebin сервис выводы команд journalctl -xe и содержимое файла лога dmesg от прошлой загрузки, когда произошло падение, а сюда помещай ссылки.

Без логов - можно только гадать по описанию симптомов.

Если есть второй комп - подключись по SSH к ПК с Linux и просматривай логи в реальном времени.

anonymous
()
Ответ на: комментарий от firkax

Я, как догадался? По некоторым причинам уже месяц работаю из дома. Периодически отвлекаюсь от рабочих задач. Аналитически обдумать проблему на форуме, предложить подход к решению.

Возможно, немного дурею от сидения дома. Но пока выйти в привычный режим работы с офиса не могу.

На рабочем ПК - рабочие задачи и тут залогинен на форуме. С домашнего ноута - просто не залогинился. Кодю, решаю рабочие моменты, переключаюсь иногда на форум.

Я так предсказуем по стилю? Хотя, наверное я один из немногих на форуме, кто пишет такие длинные посты, с кучей предположений. И с обоснованиями выводов. Но так сейчас думается разумом.

kostik87 ★★★★★
()
Последнее исправление: kostik87 (всего исправлений: 1)
Ответ на: комментарий от firkax

в общем, вот что успел сфоткать в момент полного зависания при попытке установить NixOS из лайфсд https://pasteboard.co/jMMMuRZJ4B2B.jpg

пойду учиться нормально логи собирать

nya_desu
() автор топика
Ответ на: комментарий от nya_desu

Как видишь, по какой-то причине теряется доступ к SATA диску на 8 порту SATA контроллера.

SATA диски есть в системе?

второй на тб 970 как SATA,

Вот он у тебя и отваливается. Ты на него видимо и linux ставишь.

Написал же проверь подключение накопителей. Первым сообщением. Как кабели все подключены. Переподключи.

Нет, зачем, у меня всё в порядке.

Windows у тебя не падает потому что nvme не отваливается. А Linux отваливается системный диск.

Хотя вообще странно, помню году так в 2012-2016 в помещении, где находились администраторы на одном заводе стоял комп с тогда ещё IDE накопителями. С открытым корпусом.

И там был Debian, какой не помню уже.

Так вот у него на ходу частично вынули IDE кабель с разъёма системного накопителя. А потом подоткнули. Так он даже не чихнул. Конечно ошибки чтения были, но то, что загружено в память, DE (среда рабочего стола), браузер (Firefox) продолжали работать, даже страницы новые грузились.

Потом IDE шлейф вставили обратно и всё продолжило работать.

Странно, что сейчас не так.

Проблема аппаратная, а ты не верил.

Молодец, что собрал логи.

anonymous
()
Ответ на: комментарий от nya_desu

Да вроде уже нечего собирать, меняй ssd. Или кабель но вряд ли. И ещё более вряд ли: переткнуть в другие разъёмы на материнке или в другую материнку.

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 1)
Ответ на: комментарий от firkax

Я так и подумал )))

Ну это их проблемы, что читать лень. Я же стараюсь помочь, ну а в голове сразу вариантов, т.к. продумывается сразу несколько причин, скромничать не буду, опыт в IT есть, может не такой большой как хотелось бы, но всё же.

Лень читать - это бич современности.

А ещё лень думать и оформлять правильно сообщения.

Но ты прав ))).

anonymous
()
Ответ на: комментарий от firkax

Мне, как ни странно тоже лень, я сразу пишу все возможные причины проблемы, как проверить и устранить и пускай автор проверяет.

Проблема же его. Пришёл за помощью, раз у самого мысли иссякли - пускай проверяет. Это его проблема и его обязанность её решать.

Поэтому пишу так, чем одно сообщение с одним предположением, потом автор всё же проверяет, второе сообщение с другим предположением и так далее.

Поэтому сразу одно и обо всём.

anonymous
()

Итак, проблема и вправду чисто в этом sdd, подключил старенький хард, на него всё поставилось без единого писка, установленную ось тот ssd крашит просто существуя, так что его отправил куда подальше. Вопрос исчерпан, но ещё немного поэкспериментирую. Простите за мою некомпетентность, и большое спасибо за помощь, вы лучшие :3

nya_desu
() автор топика
Ответ на: комментарий от nya_desu

Просто не бойся сам пробовать решать проблемы. Но если что приходи и более развёрнуто описывай проблемы.

Имеющиеся накопители в системе лучше указывать в шапке, ну и теперь ты знаешь, что нужно смотреть логи.

Удачи.

anonymous
()
Ответ на: комментарий от anonymous

«не все ядра» вряд ли, но стресс тесты действительно бывают очень разные. один будет работать там где другой почти сразу повалится

anonymous
()