LINUX.ORG.RU

Жёсткий диск заикается

 , ,


0

3

Не очень старый Seagate (изготовлен в 2018, работает с 2022) внезапно начал «заикаться»: при чтении файла процесс зависает с характерным тихим «бряком» диска, затем какое-то время тарахтит, как дисковод на сбойном секторе. Времени возиться с этим не было, поэтому терпел, хотя заикания случались всё чаще.

Пару дней назад компьютер отключил мониторы из-за длительной неактивности, после чего прекратил реагировать на внешние раздражители. Кроме Alt-SysRq, на которую мигал светодиодами клавиатуры. После ресета GRUB отказался грузиться.

Загрузился со старого диска (Toshiba), который при последнем включении работал нормально — на нём тоже начались заикания, с паузами до 2 минут. Сделал на нём загрузочные флешки, опробовал, хотел переделать — на этом диске GRUB тоже отказался грузиться. То есть виновата материнская плата, которая портит диски.

В итоге переставил Seagate в другой системный блок, загрузился с флешки и просканировал fsck — нашлось несколько ошибок, которые были исправлены. За сутки заикания не проявлялись.

Вопросы:

  1. Что это было? Конденсаторы на материнской плате помирают?

  2. Как оценить нанесённый диску ущерб? Как эти сбои сказались на достоверности данных в таблице SMART?

★★★★★

Кабели и питалово стоит проверить.

Замена SATA-кабеля нередко решает проблему.

wandrien ★★★
()
Ответ на: комментарий от wandrien

Кабели и питалово стоит проверить.

Замена SATA-кабеля нередко решает проблему.

С кабелей начал — без изменений. Блоку питания меньше полугода. Сейчас этот диск работает с тем же кабелем SATA, с которым он был в сбойной машине.

question4 ★★★★★
() автор топика

Блок питания меняй, у меня похожее было - помогло

superuser ★★★★★
()

Жёсткий диск заикается

Дай попить ему.

Как эти сбои сказались на достоверности данных в таблице SMART?

Смарт - очень не точный показатель.

То есть виновата материнская плата, которая портит диски.

А питание в порядке? Если бп поменять так же будут икать диски?

frunobulax ★★★★
()

SATA диск с обычным разъёмом 7+15 питается не от материнской платы, а от блока питания напрямую. В блоке питания тоже есть конденсаторы.

iliyap ★★★★★
()
Ответ на: комментарий от greenman

В dmesg ошибок не было?

Тогда не посмотрел, а сейчас уже не узнать.

question4 ★★★★★
() автор топика
Ответ на: комментарий от iliyap

SATA диск с обычным разъёмом 7+15 питается не от материнской платы, а от блока питания напрямую. В блоке питания тоже есть конденсаторы.

И блок изготовлен в этом году. Можно, конечно, попробовать.

question4 ★★★★★
() автор топика
Ответ на: комментарий от frunobulax

А питание в порядке? Если бп поменять так же будут икать диски?

Блок питания новый. Проверю, когда найду другой рабочий.

question4 ★★★★★
() автор топика

Когда диски были IDE и питались через толстые молексы, я умудрялся со стороны проводов в эти разъемы втыкать выводы электролитов. Обычно 3300мкФ@16В хватало даже при подыхающем БП

Как вариант можешь снять изоляцию на +12 и GND проводах питания диска как можно ближе к нему самому и припаять электролит непосредственно туда.

timdorohin ★★★★
()
Последнее исправление: timdorohin (всего исправлений: 1)
Ответ на: комментарий от timdorohin

Это отличный вариант когда надо прочитать срочно что-то с hdd на полудохлом БП и больше нет никаких вариантов. Но вообще лучше не подтыкивать электролиты, а заменить неисправные в БП.

Dimez ★★★★★
()
Ответ на: комментарий от Dimez

Очень часто они настолько неэргономично расположены, что приходится пол-платы распаивать чтоб до них добраться.

Недавно приходилось выпаивать диоды вместе с радиатором на который они прикручены потому что он нависал над электролитами в SFX БП компа-NAS.

Диоды пришлось выпаивать из-за того, что открутить их от радиатора можно только если выпаять сетевые электролиты и снять радиатор горячей стороны.

timdorohin ★★★★
()
Ответ на: комментарий от timdorohin

Очень часто они настолько неэргономично расположены, что приходится пол-платы распаивать чтоб до них добраться.

Вот тут да, два чая!

SFX

Это особенность уменьшенных размеров SFX, а вот когда в обычном ATX БП, чтобы добраться до электролитов, надо непойми что изобразить - бесит вдвойне.

Dimez ★★★★★
()
Ответ на: комментарий от Dimez

а вот когда в обычном ATX БП, чтобы добраться до электролитов, надо непойми что изобразить - бесит вдвойне.

Так совместили две полезные штуки же:

1) более компактно всё упихали

2) уменьшили шанс что кто-то будет перепаивать в нём электролиты и увеличили - что купят новый БП

firkax ★★★★★
()
Ответ на: комментарий от firkax

Так совместили две полезные штуки же

Смотря для кого полезные :)) Вторая для меня, например, вредная.

Dimez ★★★★★
()

После ресета GRUB отказался грузиться.

и просканировал fsck

И GRUB при этом переустанавливали, или grub был целым?

на достоверности данных в таблице SMART

Таблица у вас, вы её и изучайте. Вы, ведь, как начались проблемы, стали регуляно снимать SMART, чтобы видить изменения в динамике?

Про БП много написали, можно пованговать про материнку. Если я правильно помню, то по SATA-кабелю всё время должны передаваться/приниматься битики. Если не данные, то ALIGN-последовательности. Если HOST не видит битиков, то он туда начинает COMRESET отправлять. Возможно, что если сильно ухудшилась физическая среда передачи в паре B (host RX), то host стал переодически терять передаваемые ему биты, насиловать НЖМД несколькими reset подряд, отсюда и звуки тарахчения. Со стороны хоста счётчика CRC-error нету, оценить насколько хорошо передача от НЖМД к материнке нельзя. Если кабель хороший, то остаётся холодная пайка на материнке (могут быть все SATA разъёмы одинаково хреново пропаены) и потеря ёмкости керамическим конденсаторами между чипом и разъёмом.

mky ★★★★★
()

Есть ещё вариант температуры - hdd не любят как слишком жаркий, так и слишком холодный воздух.

И к логопеду его сводить обязательно.

Bfgeshka ★★★★★
()
Ответ на: комментарий от mky

GRUB при этом переустанавливали, или grub был целым?

Не знаю, GRUB был настроен только на legacy BIOS boot, грузиться не на чем. Пока гружусь с флешки.

Таблица у вас, вы её и изучайте. Вы, ведь, как начались проблемы, стали регуляно снимать SMART, чтобы видить изменения в динамике?

Прошлогодний: https://pastebin.com/QJLNWujW (задолго до начала «заиканий»)
Сегодняшний: https://pastebin.com/Gc9G9HyQ

по SATA-кабелю всё время должны передаваться/приниматься битики. Если не данные, то ALIGN-последовательности. Если HOST не видит битиков, то он туда начинает COMRESET отправлять. Возможно, что если сильно ухудшилась физическая среда передачи в паре B (host RX), то host стал переодически терять передаваемые ему биты, насиловать НЖМД несколькими reset подряд, отсюда и звуки тарахчения.

Что-нибудь такое я и предполагал.

Со стороны хоста счётчика CRC-error нету, оценить насколько хорошо передача от НЖМД к материнке нельзя. Если кабель хороший, то остаётся холодная пайка на материнке (могут быть все SATA разъёмы одинаково хреново пропаены) и потеря ёмкости керамическим конденсаторами между чипом и разъёмом.

Про керамические не знаю, но некоторые электролитические выглядят выпуклее, чем положено.

question4 ★★★★★
() автор топика
Ответ на: комментарий от question4

По поводу SMART'а. Есть непонятный Power-Off_Retract_Count, который у разных НЖМД значит разное, но иногда означает аварийное пропадание питания. С другой стороны, если БП новый, значит какое-то время этот НЖМД работал на старом, может счётчик там накрутился, а может в этот счётчик считались какие-то нормальные события.

Однозначно можно сказать, что плохо было с каналом передачи от хоста к винту (Number of ASR Events, Number of Interface CRC Errors). После каждого ASR (Asynchronous Signal Recovery) хост должен делать COMRESET. Здесь Number of Hardware Resets заметно больше ASR, скорее всего не только НЖМД терял связь с хостом, но и хост терял НЖМД, то есть с обратным каналом тоже плоховато.

Один realloc сектор и ноль pending, вроде регулярные reset не особо навредили поверхности, хотя тест давно не проводился.

По поводу конденсаторов. Вздутые электролиты обычно дают проблемы с каким-либо питанием. Но, даже если у вас SATA-контроллер отдельной микросхемой, то питание у него общее с чем-то ещё. Сбои по питанию материнки обычно ведут к более заметным последствиям, чем Reset (клацанье) НЖМД. Хотя всё может быть питания не хватает только усилителям/формирователям сигнала, а цифровая часть контроллера ещё работает.

Вздутые/дохлые конденсаторы меняют в любом случае, даже если всё работает, причём группой. Подозрительные можно выпаять, измерить ёмкость и ESR, если что впаять обратно, так как уже давно в магазинах продаётся такой шлак, а не кондёры, что старый может быть лучше нового.

mky ★★★★★
()
Ответ на: комментарий от mky

Один realloc сектор и ноль pending, вроде регулярные reset не особо навредили поверхности

Спасибо за обнадёживание.

question4 ★★★★★
() автор топика
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.