LINUX.ORG.RU

гарантия по кол-ву битых секторов диска


0

1

есть два диска, и оба постепенно выходят из строя
вот смарт первого

fatalist@fatalist-pc:~$ sudo smartctl -a /dev/sda
smartctl 5.40 2010-07-12 r3124 [i686-pc-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar Black family
Device Model:     WDC WD5001AALS-00L3B2
Serial Number:    WD-WCASZ0080081
Firmware Version: 01.03B01
User Capacity:    500 106 780 160 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Fri Sep 16 21:38:37 2011 MSD
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x84)	Offline data collection activity
					was suspended by an interrupting command from host.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		 (8100) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 (  96) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x303f)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       7951
  3 Spin_Up_Time            0x0027   162   160   021    Pre-fail  Always       -       4866
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       545
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   072   072   000    Old_age   Always       -       20691
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       537
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       456
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       545
194 Temperature_Celsius     0x0022   103   096   000    Old_age   Always       -       44
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   199   199   000    Old_age   Always       -       109
198 Offline_Uncorrectable   0x0030   199   199   000    Old_age   Offline      -       97
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       2
200 Multi_Zone_Error_Rate   0x0008   199   199   000    Old_age   Offline      -       202

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

число кандидатов на перераспределение медленно, но уверенно растет, сейчас как видно 109
так же с диска невозможно считать некоторые файлы, ошибка ввода/вывода
вот смарт второго
fatalist@fatalist-pc:~$ sudo smartctl -a /dev/sdb
smartctl 5.40 2010-07-12 r3124 [i686-pc-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar Black family
Device Model:     WDC WD5001AALS-00L3B2
Serial Number:    WD-WCASZ0079125
Firmware Version: 01.03B01
User Capacity:    500 106 780 160 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Fri Sep 16 21:41:05 2011 MSD
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x84)	Offline data collection activity
					was suspended by an interrupting command from host.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		 (8400) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 100) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x303f)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   161   159   021    Pre-fail  Always       -       4941
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       530
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   072   072   000    Old_age   Always       -       20663
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       527
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       446
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       530
194 Temperature_Celsius     0x0022   106   096   000    Old_age   Always       -       41
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       6
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x0008   200   199   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

этот продержался дольше первого на месяц, и то начал сыпать неопредленными секторам, сейчас их 6
покупались одновременного, гарантия на оба диска истекает в конце февраля следующего года
магазин без проблем меняет по гарантии, смотрится смарт и сразу выдаются деньги, прям в один день
есть опыт, так как менял уже диск, но там было совсем туго, около 1000 кандидатов и 300 ремапленных секторов
собственно вопрос, какое количество ремапленных и/или кандидатов должно быть, чтобы случай был признан гарантийным?
пока на дисках только кандидаты, но тем не менее некоторые файлы не читаются
является ли случай гарантийным, если только кандидаты, а ремапленных нет?

> Western Digital Caviar Black

Вот говоришь людям: дохнут Caviar Black, часто жалуются, возьми другого вендора. Берут же...

Можно обменять по гарантии при наличии бэдов, иди мучай продавцов.

Deleted
()
Ответ на: комментарий от Deleted

а про Seagate что скажешь?
тот диск, который меняли кстати тоже был WD (внешний, 2.5), сейчас купил сигейт 1 тб внешний усб 2.5 на те деньги которые вернули (а сломанный был 500гб, бесплатный апгрейд :) )
слабо верю что он при таких параметрах проработает дольше гарантии, ну да ладно, магазин меняет, бэкапы делаются
просто отнимает это время, вот и гадаю сколько проживёт очередный диск :)

Fatalist
() автор топика
Ответ на: комментарий от Fatalist

> а про Seagate что скажешь?

Количество брака у всех производителей примерно одинаково. Что Самсунг, что Сигейт... Хитачи вроде вообще купил кто-то, не? Басни про то, что ВД дохнут, а дугие нет - не более чем басни. Бери любой, который по объему подходит, и не парься.

anonymous
()
Ответ на: комментарий от Fatalist

У меня так Сеагате пашет уже 4 года вообще без проблем, как новенький. Самые нормальные диски это у них, в отличие от.

anonymous
()
Ответ на: комментарий от anonymous

ну да, не совсем понятно с этими дисками
по статистике, своей и знакомых, у одних ломаются сигейт, и они рекомендуют вд, у других наоборот, у третьих самсунги живут долго
сейчас наверное попробую сигейт, посмотрим, как приживутся

Fatalist
() автор топика
Ответ на: комментарий от Deleted

Очеь странно. Через меня прошло больше 20 WD CB, года за 4 ни один ещё не сдох.

vitruss ★★★★★
()
Ответ на: комментарий от Deleted

У меня гнусмас недавно отказывать начал. Проработал полтора года. Вот смарты перед тем как я его отдал для опытов.

=== START OF INFORMATION SECTION ===
Model Family: SAMSUNG SpinPoint F2 EG
Device Model: SAMSUNG HD103SI
Firmware Version: 1AG01118

=== START OF READ SMART DATA SECTION ===
9 Power_On_Hours 0x0032 098 098 000 Old_age Always - 12601
13 Read_Soft_Error_Rate 0x000e 099 001 000 Old_age Always - 2497
196 Reallocated_Event_Count 0x0032 097 097 000 Old_age Always - 130
kombrig ★★★
()
Ответ на: комментарий от kombrig

Ну так неси сдавай по гарантии.

Я ж не говорю что все WDCB дохнут, просто у них не наблюдается той хвалёной надёжности, за которой все гонятся.
У меня на конторе два WDCB, держащих архив видеонаблюдения, начали зарастать бэдами через ~год использования.
Сигейты, живущие на аналогичной машинке в аналогичных условиях на другом объекте, нормально работают пятый год.

ЗЫ: Дома живёт самсунг 2006.04 выпуска с 1М+ Power_On_Hours — ни одного бэда.

Deleted
()

У мну макстор 6 лет проработал и умер, на самсунге умер DMA, но все еще ни одного бэда - 4 года, WD - куплен в начале 2011, пока ни одного бэда, но проблеммы с ним уже были. Раньше и трава была зеленее, и винты надежнее... :D

Deleted
()
Ответ на: комментарий от Deleted

>Раньше и трава была зеленее, и винты надежнее... :D

Давай, рассказывай. Я ещё помню, как они массово от бэд-блоков помирали, пока смарта не было.

router ★★★★★
()

емнип, наличие в поле «бэдсекторы» любой цыфирки, отличной от нуля, у всех адекватных производителей означает гарантийный случай. Бэдов быть не должно.

stevejobs ★★★★☆
()
Ответ на: комментарий от stevejobs

ну да, на остальных форумах говорят, что именно ремапанные секторы должны быть
у меня пока таких нет, только кандидаты, однако, некоторые файлы не читаются
думаю надо проверить диски MHDD, может и вылезут после тестов ремапанные

Fatalist
() автор топика
Ответ на: комментарий от Fatalist

предлагаю вначале перетереть(!) диск с MHDD, а потом залить на него фильмеца на полный объем.

у меня такая шляпа с гринами была. В течение гарантийного срока скорость на части секторов (на _большой_ части) падала и падала, хотя MHDD/Victoria не могли ничего сказать плохого кроме «медленности», по смарту тоже всё было ОК.

вся эта туева куча таки стала бэдами, но уже после завершения гарантийного срока. Диск пришлось прибить гвоздями к стене в назидание потомкам.

сейчас стоят блэки, вроде ок работают.

stevejobs ★★★★☆
()
Ответ на: комментарий от stevejobs

у меня не совсем так, копирую например файл
он копируется до определенного размера, потом останавливается, вылетает с ошибкой ввода/вывода
в логах такие сообщения, причем их много

Sep 17 14:27:32 fatalist-pc kernel: ata10.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
Sep 17 14:27:32 fatalist-pc kernel: ata10.00: irq_stat 0x48000000
Sep 17 14:27:32 fatalist-pc kernel: ata10.00: failed command: READ FPDMA QUEUED
Sep 17 14:27:32 fatalist-pc kernel: ata10.00: cmd 60/00:00:f7:0a:66/02:00:00:00:00/40 tag 0 ncq 262144 in
Sep 17 14:27:32 fatalist-pc kernel:         res 41/40:00:52:0b:66/00:00:00:00:00/40 Emask 0x409 (media error) <F>
Sep 17 14:27:32 fatalist-pc kernel: ata10.00: status: { DRDY ERR }
Sep 17 14:27:32 fatalist-pc kernel: ata10.00: error: { UNC }
Sep 17 14:27:32 fatalist-pc kernel: ata10.00: configured for UDMA/133
Sep 17 14:27:32 fatalist-pc kernel: ata10: EH complete
Sep 17 14:27:34 fatalist-pc kernel: ata10.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
Sep 17 14:27:34 fatalist-pc kernel: ata10.00: irq_stat 0x48000000
Sep 17 14:27:34 fatalist-pc kernel: ata10.00: failed command: READ FPDMA QUEUED
Sep 17 14:27:34 fatalist-pc kernel: ata10.00: cmd 60/00:00:f7:0a:66/02:00:00:00:00/40 tag 0 ncq 262144 in
Sep 17 14:27:34 fatalist-pc kernel:         res 41/40:00:52:0b:66/00:00:00:00:00/40 Emask 0x409 (media error) <F>
Sep 17 14:27:34 fatalist-pc kernel: ata10.00: status: { DRDY ERR }
Sep 17 14:27:34 fatalist-pc kernel: ata10.00: error: { UNC }
Sep 17 14:27:34 fatalist-pc kernel: ata10.00: configured for UDMA/133
Sep 17 14:27:34 fatalist-pc kernel: sd 9:0:0:0: [sdb] Unhandled sense code
Sep 17 14:27:34 fatalist-pc kernel: sd 9:0:0:0: [sdb]  Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Sep 17 14:27:34 fatalist-pc kernel: sd 9:0:0:0: [sdb]  Sense Key : Medium Error [current] [descriptor]
Sep 17 14:27:34 fatalist-pc kernel: Descriptor sense data with sense descriptors (in hex):
Sep 17 14:27:34 fatalist-pc kernel:        72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 
Sep 17 14:27:34 fatalist-pc kernel:        00 66 0b 52 
Sep 17 14:27:34 fatalist-pc kernel: sd 9:0:0:0: [sdb]  Add. Sense: Unrecovered read error - auto reallocate failed
Sep 17 14:27:34 fatalist-pc kernel: sd 9:0:0:0: [sdb] CDB: Read(10): 28 00 00 66 0a f7 00 02 00 00
Sep 17 14:27:34 fatalist-pc kernel: end_request: I/O error, dev sdb, sector 6687570

Fatalist
() автор топика
Ответ на: комментарий от stevejobs

ванильное, 2.6.39.4
так как это сервер кс, то делал некоторые оптимизации по этому гайду
в том числе пересборку ядру, вот конфиг
ну вроде драйвера не затрагивает, не думаю что в этом причина

Fatalist
() автор топика
Ответ на: комментарий от Fatalist

ЕМНИП, remap сектора появляются только при ошибке записи. То есть нужно просто чего-то записать на весь диск и все кандидаты передут в ремап.

mky ★★★★★
()
Ответ на: комментарий от unanimous

возможно, об этом говорят ошибки UDMA_CRC_Error_Count
но, их мало, и откуда тогда кандидаты с нечитаемой информацией?

Fatalist
() автор топика
Ответ на: комментарий от Fatalist

Ещё можно запускать SMART self-test (короткий и длинный), правда, при этом не должно быть работы с винтом (чтение/запись файлов), но данные не портятся и видно, есть ли ошибки чтения или проблема в кабеле.

mky ★★★★★
()
Ответ на: комментарий от anonymous

Дохнут все. Примерно с равной вероятностью. Но вот причины отказа (и последствия) при этом - совершенно разные :)

Сигейты к примеру по причине кривой фирмвари с отсутствием обработки ошибок в служебке и с (подозреваю) все еще неустраненными багами, приводящими к порче служебки (хоть и реже, чем в печально известных 7200.11), часто «работают-работают, а на утро - оп, и не работают».

Самсунги - обычно просто начинают постепенно осыпаться. ИМХО - идеальное поведение для винта, на котором хранятся ценные данные.

WD - как повезет. Много семейств со своими, особенными «прелестями», кто сыпется, а кто и просто издыхает молча. Хотя у меня блэк на основной машине шуршит нормально, а на тазике пара гринов крутится (с выключенной автопарковкой голов) совместно с парой самсунгов - я их считаю лотереей.

Хитачи - что-то сказать по ним сложно, мало их продается. Большой конструктивный плюс - то, что контактные площадки, ведущие к гермоблоку (больное место прочих вендоров), не просто залужены, а на них напаяны оловянные шарики. Те несколько экземпляров, что сейчас имеются в работе - нарканий не вызывают.

NiTr0 ★★★★★
()
Ответ на: комментарий от Fatalist

Винт сам будет читать все свои сектора, потом в выводе SMART вместо строки

No self-tests have been logged.  [To run self-tests, use: smartctl -t]

будет строка с результатами теста. Что-то вроде:

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%        23         -
mky ★★★★★
()
Ответ на: комментарий от Fatalist

а какие диски посоветуете?

Samsung и Hitachi.

iZEN ★★★★★
()
Ответ на: комментарий от Fatalist

Long/Extended тест читает всю поверхность без ограничения по времени. Короткий тест читает отдельные области и, иногда, «подозрительные» сектора, но с ограничением по времени.

mky ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.