LINUX.ORG.RU

[hdd] Бэдблоки?

 


0

2

Всем доброго времени суток. В общем такая ситуация. Есть софтовый RAID5 из 4-х дисков (HotSpare-диска нет), который переодически перестраивается без видимых причин.

При этом в /var/log/messages колличество подобных записей:

Jan 24 03:39:11 srv kernel: [362313.527980] ata3.00: exception Emask 0x0 SAct 0x6 SErr 0x0 action 0x0
Jan 24 03:39:11 srv kernel: [362313.527991] ata3.00: irq_stat 0x40000008
Jan 24 03:39:11 srv kernel: [362313.528000] ata3.00: failed command: READ FPDMA QUEUED
Jan 24 03:39:11 srv kernel: [362313.528017] ata3.00: cmd 60/00:08:00:9a:6a/04:00:00:00:00/40 tag 1 ncq 524288 in
Jan 24 03:39:11 srv kernel: [362313.528021]          res 41/40:00:f8:9d:6a/00:00:00:00:00/40 Emask 0x409 (media error) <F>
Jan 24 03:39:11 srv kernel: [362313.528029] ata3.00: status: { DRDY ERR }
Jan 24 03:39:11 srv kernel: [362313.528035] ata3.00: error: { UNC }
Jan 24 03:39:11 srv kernel: [362313.535930] ata3.00: configured for UDMA/133
Jan 24 03:39:11 srv kernel: [362313.535966] ata3: EH complete

В SMART'е жёсткого диска растёт параметр «Raw_Read_Error_Rate», полностью смарт тут - http://nopaste.info/b281ec5914.html

Сообственно вопросы:

1. Можно ли использовать badblocks для проверки работающего HDD, если нет - подскажите по параметрам mdadm - как его на время вывести из массива?

2. Реально ли обменять винт по гарантии?

Можно ли использовать badblocks для проверки работающего HDD

Можно. В режиме чтения.

Только это у тебя больше похоже на плохой кабель или нехватку мощности БП. Особенно, учитывая, что

5 Reallocated_Sector_Ct  0x0033  200  200  140    Pre-fail  Always      -      0 

как бы намекает на отсутствие дефектов поверхности.

GotF ★★★★★
()
Ответ на: комментарий от GotF

Можно. В режиме чтения.

Могли бы Вы подсказать ключи? А то из мана не очень понятно

Только это у тебя больше похоже на плохой кабель или нехватку мощности БП. Особенно, учитывая, что

Скажите, можно ли как-то проверить достаточно ли питания? Шлейф заменил на новый, подключил к другому питанию.

Стоит такой блок - http://www.nix.ru/autocatalog/power_supply_enhance/Enhance_ATX0260GA_600W_2x4_2x6_83756.html

P.S.: Raw_Read_Error_Rate отличен от 0 только на этом диске.

WhiteWolf
() автор топика

без видимых причин

подобных записей

хрена се «без видимых причин». Веник поменяй если есть запасной. Если помогло то причина в нём. Менее вероятны проблемы с материнкой, шлейфом или с драйвером. У меня примерно такая же беда на серваке.

true_admin ★★★★★
()
Ответ на: комментарий от WhiteWolf

>> Могли бы Вы подсказать ключи? А то из мана не очень понятно

read-only делается по умолчанию, без дополнительных ключей.

GotF ★★★★★
()
Ответ на: комментарий от Rost

Можно попробовать поставить этот диск в другой комп и прогнать badblocks -w. Если после этого Reallocated_Sector_Ct увеличится значит дохнет диск, если нет - скорее всего виноват БП.

Rost ★★★★★
()

Запосного винта и БП нету к сожалению. В пользу БП говорит то что ошибки проявляются на одном и том же винте, не зависимо от того к какому проводу питания я его подключаю

WhiteWolf
() автор топика
Ответ на: комментарий от WhiteWolf

Похоже дело в винте, только запустил и уже:

# badblocks /dev/sdb
2709248
2749368
WhiteWolf
() автор топика

>2. Реально ли обменять винт по гарантии?
Я 2-х терабайтник поменял по гарантии, когда ~100 бэдов образовалась

xorik ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.