LINUX.ORG.RU

Как отладить случайные зависания системы и внезаптные segmentation fault разного ПО?

 , , ,


0

2

Имеем:

1) AMD Ryzen 9 3900X
2) X570 AORUS ELITE
3) Nvidia RTX 2070S
4) Система Linux Mint 17.2 с ядром 3.19.0-39, всё работает стабильно, но сама система давно устарела, обновлений нет, новый софт зачастую работать отказывается.
5) Система Linux Mint 19.3. Иногда работает стабильно и всё отлично. Иногда случайные программы падают с сегфолтом без видимой причины. Периодически (очень редко) просто зависает система. Стоковое ядро (вроде 5.0), равно как и и более свежие ядра, в том числе из пакета 5.6.3 дают аналогичную картину.

Вопросы:

1) Как отладить эту проблему? Обращался в саппорт амд - послали лесом со словами «Please be informed that AMD Ryzen™ 9 3900X officially have drivers for Windows 10 - 64-Bit Edition».
2) Может ли быть проблема в дистрибутиве? Не думаю что ситуацию будет другой. Даже если я накачу ubuntu mate, и следом напишу в багтрекер убунты, всё равно с меня потребуют провести некоторые исследования ибо никто неведомой хренью заниматься не будет и не хочет
3) Может ли быть дело в том, что система «Linux Mint 17.2» установлена на обычном SSD, который подключается через SATA, а «Linux Mint 19.3» установлен на nvme ssd?

Доп информация:

1) https://github.com/suaefar/ryzen-test не показал результатов, система не падает
2) Разгоном CPU и памяти не занимаюсь, все настройки в bios стоят штатные, версия bios самая последняя, СО достаточно эффективная и температурный режим всегда в норме
3) Пакет с микрокодом установлен
4) Судя по табличке https://wiki.gentoo.org/wiki/Ryzen всякие костыли и опции с отключением cstates не нужны в более новых Ryzen-ах. Это так или стоит попробовать?
5) dmesg: https://paste.ubuntu.com/p/Bqh9RtQ5tt/

★★★★★

Ответ на: комментарий от reprimand

я поменял нвидию на амд. Заметно реже стало все падать. То есть вообще не припоминаю вылетов именно после смены видюхи. С учетом того что там блоб, неизвестно что туда понапихали.

xDShot ★★★★★ ()
Последнее исправление: xDShot (всего исправлений: 1)
Ответ на: комментарий от anonymous

Пробовать ставить не ненужнодэ дистрибутив.

честно говоря мне влом поставить другой, более мейнстримный дистрибутив, с поддержкой и обещаниями штабильности, но я уверен что проблема останется

вопрос в том останешься ли ты в этом треде.

reprimand ★★★★★ ()


-------
добавил dmesg в шапку темы

reprimand ★★★★★ ()

Иногда случайные программы падают с сегфолтом без видимой причины.

Лечится мемтестом, инфа 100%. Можешь поменять плашки памяти местами, если поведение изменится - дело точно в них.

izzholtik ★★★ ()
Последнее исправление: izzholtik (всего исправлений: 1)
Ответ на: комментарий от izzholtik

оффтопик и старый линукс работают без проблем

мемтест не показал ошибок

сколько прогонов мемтеста надо сделать чтобы определить проблему?

reprimand ★★★★★ ()
Ответ на: комментарий от izzholtik

только мемтест нифига не ловит на практке во многих случаях

anonymous ()
Ответ на: комментарий от reprimand

Не имей себе мозги и потрать полчаса на тест с заведомо исправной оперативой, у тебя слишком типичные симптомы для этого говна.

И да, нормальная работа одной ОС и вылеты второй - вполне обычная ситуация.

izzholtik ★★★ ()
Ответ на: комментарий от anonymous

а как это отмазывает амуде если это не первый раз у гигабайта?

Thero ★★★★★ ()
Ответ на: комментарий от iZEN

Модули памяти в те ли слоты установлены?(A2, B2).

а почему надо во вторые, а не в первые? всегда думал, что надо в первые

teod0r ★★★★★ ()
Ответ на: комментарий от anonymous

Драйвер для этого видео не в вакууме находится, правильно? Он находится в ядре (а пространстве ядра, если это блоб) и его сбои влияют на работу всей системы. Т.е. вызывают зависания и перезагрузки. Монолитное ядро, сэр.

anti_win ★★ ()

Итак, имеем случайные никак не повторяемые зависания, сегфолты. Раз не повторяемые значит это оборудование + всё что связано с ним: драйвера, микрокоды и т.д. Оборудование это только методом исключений

В этом случае надо идти по порядку исключая каждое устройство. Начать предлагаю в самом видимом различии между двумя ОС:

  • Дисковая подсистема. Поставить новую ОС на старый диск и посмотреть.
  • Затем память (как советовали выше) менять местами, снижать частоту, тайминги. другие комплекты, оставить одну планку в разных слотах. Случайные сегфолды, именно приложений, заставляют думать про неё.
  • Потом видеокарту. Смена драйверов, замена на совсем другую, хз что ещё.
  • Потом материнскую плату. Не знаю, если только попробовать отключать всякие доп. функции доп. устройства
  • Процессор, ну разве что в стресс тестах. Был бы он, проявил бы себя на старой системе, поэтому его в последнюю очередь, да и то тут только заменой..

Насчёт проверить на другом дистре, ну только если на совсем другом,где реально другие версии ПО. А так смысла особо не вижу, есть же результаты двух ОС.

sv_warvar ()
Последнее исправление: sv_warvar (всего исправлений: 1)
Ответ на: комментарий от anti_win

почему у меня нет никаких сбоев, даже если намеренно заупускать сломанные приложения, некорректно использующие видеокарту?

anonymous ()

Чисто ради интереса я бы поставил manjaro или debian(лучше тестируемый, дабы ПО было свежее), если и на ней будет то же самое, то проблема может быть в 1) слабой поддержке оборудования, в частности нвидия действительно одна из самых ненадёжных штук 2) падающее ПО собрано под интел процы, возможно с использованием чисто их особенностей 3) чисто кривом софте или ПО собранном с багами оптимизаторов gcc и clang, если ПО в основном на плюсах, то есть смысл пересобрать совсем без оптимизаций.

AKonia ★★ ()
Ответ на: комментарий от anonymous

— Доктор, у меня рука болит.

— Чушь, у меня та же рука не болит.

Какая у тебя версия ядра, что за карточка? Иначе это все гадание на кофейной гуще. И твой вопрос звучал так:

каким образом видео может валить «разное ПО» а не игоря

Я на него ответил. Еще не доказано, что проблема ТСа в видеодровах. На бы увидеть хотя бы его dmesg.

anti_win ★★ ()
Ответ на: комментарий от izzholtik

не нужно бампать

я помню про тред

вчера не было возможности потестить, сегодня протестирую

reprimand ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.