LINUX.ORG.RU

Ошибка ввода/вывода. Полностью зависает система

 ,


0

2

Опять столкнулся с проблемой: Ошибка ввода/вывода

В прошлый раз удалось исправить ошибки путём выключения swap и переходом на zram, но работало всё это совсем не долго. Получилось локализовать проблему, по всей видимости что то случилось с nvme диском, пробовал снять образ системы, перенести всё на sata ssd и уже на стареньком китайском ssd kingDian всё прекрасно работает.

Так же пробовал форматировать nvme диск, переустанавливать систему, fstream. Проверял диск через victoria, fsck… никаких проблем не выявлено. Диск был куплен несколько месяцев назад и отлично работал. Неужели это аппаратная проблема и диск можно выкинуть?



Последнее исправление: Enot (всего исправлений: 1)

Погугли все доступные опции, имеющиеся в Линуксе для nvme и ssd, попробуй ими поиграться. Может, в твоём ssd или твоей материнке что-то сделано так, что вызывает ошибки на Линуксах.

Ну или это амуде как обычно.

alex1101
()

Прочитал предыдущую тему, и не смог понять при чём здесь своп. Ну да, нагрузка, хаотичная чтение-запись, но ведь ошибку выдавал не своп с крахом системы, а PCIe Bus Error. Т.е. это шина на скоростных поворотах вылетает, а не диск глючит.

Если я прав, то вообще хз что делать. Режимы в биосе попереключать? А они там вообще есть?

kirill_rrr ★★★★★
()
Последнее исправление: kirill_rrr (всего исправлений: 1)

Так же пробовал форматировать nvme диск, переустанавливать систему, fstream. Проверял диск через victoria, fsck…

«Форматировать диск» это бесполезная операция уже больше 20 лет даже для механических HDD. Для SSD - вредная. Не fstream а fstrim. Проверять через victoria для SSD - бесполезно и даже вредно (как и форматирование).

firkax ★★★★★
()
Ответ на: комментарий от basilic

Нет, но я ещё пробовал с другим nvme диском и на нём всё работает. Поэтому я склоняюсь к тому что возможно мне попался бракованный диск. Помню что когда всё работало в какой-то момент в ходе игры я заметил повреждённые текстуры, но тогда я списал это на баг после обновления игры.

Enot
() автор топика

Я тебя огорчу, возможно замена ssd тебе не поможет. Вангую тебе попался бракованный камень с битым контроллером PCI. Я такое уже встречал. Может помочь пересадка на другой свободный слот через переходник pci-e\m2.

Jameson ★★★★★
()
Последнее исправление: Jameson (всего исправлений: 1)
Ответ на: комментарий от Enot

Или замена камня. Я с одной такой амудой до потери пульса и волос на жопе сражался. Три разных ssd пробовал, они все ошибку на шине выдавали, при этом на стенде с интелем работали нормально. Я тогда уже было уверился что это мать виновата, хотя сам разъём нормально звонился. По чистой интуиции заменил камень на точно такой же, но другой экземпляр, и о чудо... Потом уже через переходник проверил, в другом слоте тоже проблем нет в случае «бракованного» камня. А потом и гуголь подтвердил что такой брак не редкость.

Jameson ★★★★★
()
Последнее исправление: Jameson (всего исправлений: 1)
Ответ на: комментарий от Jameson

Странно, просто у меня изначально всё работало. Разве брак мог проявиться спустя столько времени? Nvme где-то пол года назад поставил, а до этого стоял m2 (где-то с 2018г)

Enot
() автор топика
Ответ на: комментарий от Jameson

Ну вот тк nvme я поставил относительно недавно, то думаю проблема в нем. Хотя я даже не могу по гарантии его сдать потому что не представляю как доказать что проблема в нем :) Хотя мб и не в nvme дело

Enot
() автор топика
Ответ на: комментарий от basilic

Интересно, попробовал запустить через переходник на sata и всё заработало. Попробую значит переключиться на ядро 6.1 как тут советовали

Enot
() автор топика
Ответ на: комментарий от Enot

Nvme где-то пол года назад поставил, а до этого стоял m2 (где-то с 2018г)

А нонешний NVME у вас не M.2?

Вобще, может проблема в контактах, у модулей памяти их ведь иногда полезно протереть. Потом, что с температурами под нагрузкой, хотя бы при простом чтении dd в /dev/null (большими блоками)?

Можете ещё погуглить про nvme-cli, она даёт больше информации, чем smartctl, может что интерестное прочитаете. И, разовый сбор параметров малоинформативен, нужно смотреть и сравнивать, какие параметры SMART'а меняются со временем.

mky ★★★★★
()
Ответ на: комментарий от kirill_rrr
Checking for bad blocks in read-write mode
From block 0 to 1000204631
Testing with pattern 0xaa: done                                                 
Reading and comparing: done                                                 
Testing with pattern 0x55: done                                                 
Reading and comparing: done                                                 
Testing with pattern 0xff: done                                                 
Reading and comparing: done                                                 
Testing with pattern 0x00: done                                                 
Reading and comparing: done                                                 
Pass completed, 0 bad blocks found. (0/0/0 errors)

Enot
() автор топика

Понятия не имею в чем проблема, но видел что-то подобное связанное с командами управления питания для шины pci-e и людям помогла опция «pcie_aspm=off» для ядра. Вроде еще можно ASPM в биосе отключить, так как из-за этого бывают проблемы с nvme.

altwazar ★★★★
()
Последнее исправление: altwazar (всего исправлений: 2)