LINUX.ORG.RU

S.M.A.R.T предрекает смерть, хотя винту 3 дня.


0

1

Есть НАС. на борту SUSE Linux обрезанный. Долгое время там стоял умирающий винт с работы, то что у него смарт ругается - ожидаемо (по этому на работе его списали).
Пару дней назад купил новый винт, и что странно его смарт тоже сразу показывает полный фэйл. копятся ошибки и т.д.
Первый смарт - новый винт
Второй - старый с работы.

http://pastebin.com/dQvGexYa

Пара вопросов:
1. На сколько можно верить этому смарту? может он выдавать не правду? глючить?
1.1. Может ли он выдавать не настоящий смарт, а какой нить кэш?
2. Или это действительно механика у винта сыпится?

ЗЫЖ
Смарт смотрю так:
#smartctl -a -d marvell /dev/sda

# uname -a
Linux axentraserver.deez.mystora.com 2.6.22.18-Netgear #4 Thu Sep 3 13:29:25 EDT 2009 armv5tejl armv5tejl armv5tejl GNU/Linux


Оба винта вполне живые. Постоянно растущее значение Raw Read Error Rate - нормальное явление для сигейтов, особенно скоростных.

Deleted
()
Ответ на: комментарий от Deleted

А не, пардон, старый диск начал сыпаться - там есть «ожидающие» битые сектора.

Deleted
()
Ответ на: комментарий от Novell-ch

>смарт штука такая

Смарт штука как раз не такая. Просто некоторые несознательные личности занимаются интерпретацией RAW-значений. Чего делать без наличия спеки на диск/прошивку нельзя.

Macil ★★★★★
()
Ответ на: комментарий от Macil

И кто же эти несознательные личности? разработчики hddlife, smartmontools и всех остальных программ для отображения данных смарт?
То есть доверять этим значением абсолютно нельзя, и любому хомячку еще нужно колупаться в спеках что бы правильно интерпретировать показания?

Novell-ch ★★★★★
()
Ответ на: комментарий от vladislav

Смущает быстрорастущее число ошибок в 001 ошибки чтения, 007 частота ошибок позиционирования. 195 коррекции ошибок.
И надписи old_age, pre_fail. почему диск считается старым если его всего 7 раз включили (012)?

DeeZ
() автор топика
Ответ на: комментарий от Deleted

скоростных в смысле SATA III или обороты? если второе то диск на 5200об.

DeeZ
() автор топика
Ответ на: комментарий от DeeZ

Может быть неверная интерпретацией RAW-значений .Но скорее всего 2 причины -
1) С самого начала продан убитый неликвид .
2) Что то по питанию - часто с переходниками возникает такая проблема ,не хватает где то 0,5 вольта .

maximnik0 ★★
()
Ответ на: комментарий от Novell-ch

>и любому хомячку еще нужно колупаться в спеках что бы правильно интерпретировать показания?

Любому хомячку достаточно смотреть на нормализованные значения. А RAW-значения производитель устанавливает как ему вздумается, и соответственно, без спеки их интерпретировать нельзя. А то потом получается что жесткий диск 30 лет работает, или на свалку выкидывается совершенно рабочий диск (как у ТС).

Macil ★★★★★
()

читал где-то исследование, что чаще всего диски ломаются либо в первые 6 месяцев службы, либо, если пережили это время, то затем в течении следующих пяти лет работают достаточно надежно.

xawe
()
Ответ на: комментарий от DeeZ

DeeZ, рост Raw_Read_Error_Rate, Hardware_ECC_Recovered и Seek_Error_Rate на Сигейтах - давно уже совершенно нормальное явление. По крайней мере у большинства их моделей за последние года 4 так.

запусти smartctl -t long, если так душа за него болит :)

Надписи значат не текущее состояние, а тип параметра. Old_age - это значит, что параметр характеризует длительность использования винта (а не то, что он уже старый), точно так же и pre_fail - если текущее значение перейдёт граничное, то тогда можно считать винт близким к кончине.

DarkFlame ★★
()
Ответ на: комментарий от xawe

об этом исследование на лоре писали кстати. типа гугль составил статистику живучести винтов на своих серверах. и якобы любой винт либо дохнет совсем юным, либо живет до глубокой старости

anonymous
()
Ответ на: комментарий от maximnik0

>Sata провод поменяй.
Винты втыкаются прямо в материнку. нет провода. Это NAS.

запусти smartctl -t long, если так душа за него болит

Long (extended) offline self test failed [unsupported scsi opcode]
=(

читал где-то исследование, что чаще всего диски ломаются либо в первые 6 месяцев службы..

Да, тоже помню. Это исследование гугла. А еще там говорилось что большие диски ломаются чаще чем маленькие (до 500Гб)


Что то по питанию - часто с переходниками возникает такая проблема ,не хватает где то 0,5 вольта .

Спасибо за идею. что то не подумал помериьт БП под нагрузкой.

Надписи значат не текущее состояние, а тип параметра. Old_age - это значит, что параметр характеризует длительность использования винта (а не то, что он уже старый), точно так же и pre_fail - если текущее значение перейдёт граничное, то тогда можно считать винт близким к кончине.


Да, спасибо. Действительно (из мана):
The Attribute table printed out by smartctl also shows the «TYPE» of the Attribute. Attributes are one of two possible types: Pre-failure or Old age. Pre-failure Attributes are ones which, if less than or equal to their threshold values, indicate pending disk failure. Old age, or usage Attributes, are ones which indicate end-of-product life from old-age or normal aging and wearout, if the Attribute value is less than or equal to the threshold. Please note: the fact that an Attribute is of type 'Pre-fail' does not mean that your disk is about to fail! It only has this meaning if the Attribute's current Normalized value is less than or equal to the threshold value.


Всем спасибо. Надо искать нормальный большой комп и засунуть в него винт, от туда посомтреть смарт, и поведение винта.
А то дома только нас, роутер и плеер =)

DeeZ
() автор топика

Абсолютно новый WD Caviar black 500 Gb прожил чуть больше 3-х суток. Я тоже сначала думал что смарт врет, но постоянно растущий Reallocated_Sector_Ct все-таки смутили и на всякий случай сделал бэкап. Не прогадал... после бэкапа винт проработал еще часа 4-5 и благополучно отбросил копыта.

dgeliko ★★
()

Новый в порядке.
Старому нужно помочь с ремапом 36и битых секторов.

aidaho ★★★★★
()
Ответ на: комментарий от dgeliko

> Абсолютно новый WD Caviar black 500 Gb прожил чуть больше 3-х суток. Я тоже сначала думал что смарт врет, но постоянно растущий Reallocated_Sector_Ct все-таки смутили и на всякий случай сделал бэкап. Не прогадал... после бэкапа винт проработал еще часа 4-5 и благополучно отбросил копыта.

У ТС как раз таки с релокацией секторов проблем нет.

andreyu ★★★★★
()
Ответ на: комментарий от xawe

читал где-то исследование, что чаще всего диски ломаются либо в первые 6 месяцев службы, либо, если пережили это время, то затем в течении следующих пяти лет работают достаточно надежно.

Ага, есть такое.

erfea ★★★★★
()
Ответ на: комментарий от andreyu

У ТС как раз таки с релокацией секторов проблем нет.

Я пример привел к тому, что смарту стоит все-таки верить. А если не верить - то подстраховываться хотя бы.

dgeliko ★★
()
Ответ на: комментарий от dgeliko

> Я пример привел к тому, что смарту стоит все-таки верить. А если не верить - то подстраховываться хотя бы.

Верить стоит, но я не вижу в данном случае проблем с хардами.

andreyu ★★★★★
()

>На сколько можно верить этому смарту? может он выдавать не правду?

глючить?


доверия чуть больше 50%-60%

Может ли он выдавать не настоящий смарт, а какой нить кэш?


нет

Или это действительно механика у винта сыпится?


а хз, ошибки чтения/записи есть? dd if=/dev/винт of=/dev/null bs=16M делал?

Pinkbyte ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.