LINUX.ORG.RU

Победить поставщика некондиции

 , , ,


0

2

Добрый день.

Произведя в серверном hardware RAID массиве замену винчестера и посмотрев его данные SMART обнаружил, что винчестер уже отмолотил 5 из заявленных 9 лет срока службы. Винчестер HP GB0500EAFJH SATA (Он же Seagate ST3500320NS). С голограммной наклеечкой-серийником от HP. Я расстроился, что деньги ушли на новое оборудование, а вместо этого получен очередной геморрой.

Вопрос: Могу ли я обратиться за данными по оборудованию к HP (дата выпуска, регион реализации) и потом забодать поставщика, что он поставил б/у оборудование вместо нового? Ранее с таким не сталкивался, и, возможно, что я неправильно подхожу к решению вопроса. Прошу коллег по цеху поделиться собственным опытом и советами в решении подобных проблем.


Чем SMART смотрели ?

bdfy ★★★★★ ()
Ответ на: комментарий от bdfy

Командой:

smartctl -a -d sat+cciss,0 /dev/sg0 -H

Диск за hardware RAID контроллером под управлением hpsa.

NIR ()

Могу ли я обратиться за данными по оборудованию к HP (дата выпуска, регион реализации) и потом забодать поставщика, что он поставил б/у оборудование вместо нового?

А позвонить им (НР) не пробовал:?) Если косяк реальный, и поставщик действительно партнер НР, то ему наваляют.

dk- ()
Ответ на: комментарий от Deathstalker

И? Я уже писал, что аватарка честно стырена.

dk- ()
Ответ на: комментарий от bdfy

ПО из состава пакета smartmontools.x86-64 в среде CentOS 7.

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.10.0-514.2.2.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     GB0750C8047
Serial Number:    9QK19SCF
LU WWN Device Id: 5 000c50 0108122b1
Firmware Version: HPGB
User Capacity:    750 156 374 016 bytes [750 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ATA/ATAPI-7 T13/1532D revision 4a
Local Time is:    Fri Mar 10 08:37:00 2017 SRT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART STATUS RETURN: incomplete response, ATA output registers missing
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  625) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 171) minutes.
Conveyance self-test routine
recommended polling time: 	 (   3) minutes.
SCT capabilities: 	       (0x103f)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   078   063   044    Pre-fail  Always       -       82564741
  3 Spin_Up_Time            0x0003   099   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       14
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   069   060   030    Pre-fail  Always       -       2267705303892
  9 Power_On_Hours          0x0032   045   045   000    Old_age   Always       -       48783
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   037   020    Old_age   Always       -       14
184 End-to-End_Error        0x0033   100   100   003    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   074   057   045    Old_age   Always       -       26 (Min/Max 24/27)
194 Temperature_Celsius     0x0022   026   043   000    Old_age   Always       -       26 (0 15 0 0 0)
195 Hardware_ECC_Recovered  0x001a   052   033   000    Old_age   Always       -       82564741
196 Reallocated_Event_Count 0x0033   100   100   036    Pre-fail  Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       1
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Aborted by host               60%     48122         -
# 2  Short offline       Completed without error       00%     48122         -
# 3  Extended offline    Completed without error       00%     48122         -
# 4  Short offline       Completed without error       00%     48119         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

ID №9: Power_On_Hours == 48783
$ bc
bc 1.06.95
Copyright 1991-1994, 1997, 1998, 2000, 2004, 2006 Free Software Foundation, Inc.
This is free software with ABSOLUTELY NO WARRANTY.
For details type `warranty'. 
scale=2
48783/24
2032.62
2032.62/365
5.56

2032 дня, итого 5,5 лет. Не вдохновляет.

NIR ()
Ответ на: комментарий от dk-

Поставщик, скорее всего, не является партнёром HP никаким боком, но, чтобы мне инициировать выставление претензии надо поставщика прижучить как-то. Я полагаю, что какая-нибудь информация по устройству от, собственно, HP мне в этом поможет.

NIR ()
Ответ на: комментарий от NIR

Если он не партнер HPE, то HPE - срать. На словах тебе посочувствовать могут. Все.

dk- ()
Ответ на: комментарий от NIR

LifeTime(hours) - срок от первого старта диска.
Думаю надо считать Power_On_Hours - LifeTime(hours) и если разница более 10 часов, то попробовать вернуть.
Так же smart (Current_Pending_Sector;Offline_Uncorrectable) параметры у нового диска должны быть равны 0.
пруф.

bdfy ★★★★★ ()
Ответ на: комментарий от bdfy

Думаю надо считать Power_On_Hours - LifeTime(hours)

бред же.

LifeTime - это время наработки, на котором был запущен SMART тест. зачем вы его собрались отнимать от времени общей наработки?

а по сабжу - да, продаван прокинул, продал б/у (причем - сильно б/у) диски под видом новых. возвращайте взад, ругайтесь, требуйте замены на новые или полного возврата денег, ну и ессно сделайте ему «рекламу» во всяких отзовиках. можно еще в защиту прав потребителей обратиться (особенно если отпираться продаван будет).

NiTr0 ★★★★★ ()
Ответ на: комментарий от NiTr0

Диск покупала фирма скорее всего, соответственно, правовые отношения по договору купли-продажи между двумя юр. лицами. Закон о защите прав потребителя распространяется только на защиту прав физических лиц. А в данном случае надо смотреть ГК РФ и, внезапно, досконально изучить договор купли-продажи, поставки или что там у автора было.

baralgin ()
Ответ на: комментарий от NiTr0

Я уже выписал нужные статьи из ГК РФ и закона «О защите прав потребителей» и написал тем, кто занимался покупкой. Если история закончится хоть маленькой победой, то обязательно напишу, что за продаван такой и как всё делал, чтобы поменяли.

NIR ()
Ответ на: комментарий от baralgin

В целом, так и есть. При эскалации вопроса я воспользовался пунктом 1 ст. 476 ГК РФ, пунктами 4 (и 1) ст. 477 ГК РФ, пунктами 1 и 2 ст. 475 ГК РФ.

Обосновал так, что, раз оборудование наработало больше, чем вообще находится в наших руках, то это б/у оборудование, и утрата половины рабочего ресурса является серьёзным недостатком (неустранимым). А так как гарантийный срок ещё не истёк, то требовать замены или уменьшения цены (совсем вернуть не получится, так как уже воткнут в сервер).

NIR ()
Ответ на: комментарий от NIR

Для суда еще будет полезно отнести винт в СЦ с целью получения документа о сроке его работы.

baralgin ()
Ответ на: комментарий от baralgin

То есть недостаточно просто снять показания с датчиков самостоятельно?

NIR ()
Ответ на: комментарий от NIR

Для суда не уверен что хватит. Тут мнение независимого эксперта нужно, коим, насколько мне известно, может стать официальный СЦ. Но это если до суда дойдет. Может продавец Вам поменяет винт или стоимость уменьшит.

baralgin ()

Power_Cycle_Count - 14 не смущает? Насколько помню у seagate 2 байта в смарте и цифры которые мы видим необходимо интерпретировать иначе.

anonymous ()
Ответ на: комментарий от NIR

В прошлом году пробовал купить SAS Hitachi в маленькую контору, в 2х местах подсовывали б/у. Без проблем вернули все деньги просто по распечатке smart'а и письму на фирменном бланке об ошибочно зачисленных средствах.

Dimez ★★★★★ ()
Ответ на: комментарий от anonymous

Да, у сигейта всё не как у людей, но Power_Cycle_Count ЕМНИП так прямо и читается.

bdfy ★★★★★ ()
Ответ на: комментарий от bdfy

Я к тому что циклов маловато будет для 5 лет, и значение Power_On скорее 83 часа, или что-то около того.

anonymous ()
Ответ на: комментарий от anonymous

83? Это из какой системы счисления в какую? Чего-то я запутался.

NIR ()
Ответ на: комментарий от anonymous

нормально. не домашний же винт, серверный.

NiTr0 ★★★★★ ()
Ответ на: комментарий от anonymous

У меня есть винты с 3 годами наработки и с 10 power_on. У нас чахлые ups, поэтому так много.

bdfy ★★★★★ ()
Ответ на: комментарий от NIR

Чтобы понять в каких единицах считается PoH, выложите ещё раз smart диска.

bdfy ★★★★★ ()
Ответ на: комментарий от NIR

точно не хватит. мало ли что ты на этих датчиках насмотрел. это всё филькина грамота. для суда нужно заключение эксперта. Т.е. на сколько я понимаю нужен не просто СЦ, а именно такой который может давать судебные заключения.

AndreyKl ★★★★★ ()
Ответ на: комментарий от NiTr0

Скорее всего купили диски как контора. А защита потребов это только про физиков.

dk- ()

Могу ли я обратиться за данными по оборудованию к HP (дата выпуска, регион реализации) и потом забодать поставщика, что он поставил б/у оборудование вместо нового?

Да, можешь, лучше даже сразу сношать поставщика. И да, как ты определил что он что-то там отмотал? По SMART?

Inshallah ()
Ответ на: комментарий от NIR

Ты можешь просто вернуть или обменять, зачем тебе этот геморрой.

Inshallah ()
Ответ на: комментарий от bdfy

Теперь SMART выглядит так и ошибки ATA мне говорят только то, что винт начал осыпаться (поправьте, если ошибаюсь):

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.10.0-514.10.2.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     GB0750C8047
Serial Number:    9QK19SCF
LU WWN Device Id: 5 000c50 0108122b1
Firmware Version: HPGB
User Capacity:    750 156 374 016 bytes [750 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ATA/ATAPI-7 T13/1532D revision 4a
Local Time is:    Mon Mar 13 10:20:28 2017 SRT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART STATUS RETURN: incomplete response, ATA output registers missing
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  625) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 171) minutes.
Conveyance self-test routine
recommended polling time: 	 (   3) minutes.
SCT capabilities: 	       (0x103f)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   067   063   044    Pre-fail  Always       -       180364691
  3 Spin_Up_Time            0x0003   099   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       15
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   068   060   030    Pre-fail  Always       -       2864707461321
  9 Power_On_Hours          0x0032   045   045   000    Old_age   Always       -       48857
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   037   020    Old_age   Always       -       15
184 End-to-End_Error        0x0033   100   100   003    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   099   099   000    Old_age   Always       -       1
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   074   057   045    Old_age   Always       -       26 (Min/Max 26/26)
194 Temperature_Celsius     0x0022   026   043   000    Old_age   Always       -       26 (0 15 0 0 0)
195 Hardware_ECC_Recovered  0x001a   049   033   000    Old_age   Always       -       180364691
196 Reallocated_Event_Count 0x0033   100   100   036    Pre-fail  Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 38 (device log contains only the most recent five errors)
	CR = Command Register [HEX]
	FR = Features Register [HEX]
	SC = Sector Count Register [HEX]
	SN = Sector Number Register [HEX]
	CL = Cylinder Low Register [HEX]
	CH = Cylinder High Register [HEX]
	DH = Device/Head Register [HEX]
	DC = Device Command Register [HEX]
	ER = Error register [HEX]
	ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 38 occurred at disk power-on lifetime: 48857 hours (2035 days + 17 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff 86 c6 04  Error: UNC at LBA = 0x04c686ff = 80119551

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 01 ff 86 c6 44 00      00:06:18.111  READ FPDMA QUEUED
  2f 00 01 10 00 00 00 00      00:06:18.036  READ LOG EXT
  60 00 01 ff 86 c6 44 00      00:06:15.235  READ FPDMA QUEUED
  ef 66 00 00 00 00 00 00      00:06:15.234  SET FEATURES [Disable revert defaults]
  ef aa 00 00 00 00 00 00      00:06:15.233  SET FEATURES [Enable read look-ahead]

Error 37 occurred at disk power-on lifetime: 48857 hours (2035 days + 17 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 ff 86 c6 04  Error: UNC at LBA = 0x04c686ff = 80119551

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 01 ff 86 c6 44 00      00:06:15.235  READ FPDMA QUEUED
  ef 66 00 00 00 00 00 00      00:06:15.234  SET FEATURES [Disable revert defaults]
  ef aa 00 00 00 00 00 00      00:06:15.233  SET FEATURES [Enable read look-ahead]
  ef 82 00 00 00 00 00 00      00:06:15.233  SET FEATURES [Disable write cache]
  2f 00 01 10 00 00 00 00      00:06:15.154  READ LOG EXT

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Aborted by host               60%     48122         -
# 2  Short offline       Completed without error       00%     48122         -
# 3  Extended offline    Completed without error       00%     48122         -
# 4  Short offline       Completed without error       00%     48119         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Часть ошибок ATA выкинул из вывода, так как не давало запостить и ругалось на «Слишком большое сообщение». v_v

NIR ()
Ответ на: комментарий от anonymous

Я к тому что циклов маловато будет для 5 лет

Почему это ? Если HDD в хороших условиях работал, могло и меньше быть. У меня вот есть 25352 часа и 6 Start/Stop.

AS ★★★★★ ()
Ответ на: комментарий от NIR

Метрика в часах.
С прошлого smart прошло 3 дня.

bdfy ★★★★★ ()
Ответ на: комментарий от NIR

Теперь SMART выглядит так и ошибки ATA мне говорят только то, что винт начал осыпаться (поправьте, если ошибаюсь)

A little over 70% of the drives survive the first 8 months after their first scan error.

The critical threshold analysis confirms what the charts visually imply: the critical threshold for scan errors is one. After the first scan error, drives are 39 times more likely to fail within 60 days than drives without scan errors.

Вообще какой-то бессмысленный кидок, на один накопитель всего.

aidaho ★★★★★ ()
Ответ на: комментарий от aidaho

Ну, почему на один. Это я только взялся за работу над вопросом состояния машин. Проблем много больше.

А откуда цитата, если не секрет? И какую именно scan error имеют в виду? Интересно почитать подробнее. Сейчас очень много приходится читать про SMART, всякие BER/UER, write cache, SCT и прочее. Надо ж разбираться в теме.

NIR ()
Последнее исправление: NIR (всего исправлений: 1)

купили 500гиговый винт, а смарты говорят что винт 750гиг. нестыковочка

Suicide_inc ★★ ()
Ответ на: комментарий от Suicide_inc

Ещё какая. Надо менять поставщика. Меня тоже эти данные смущают.

NIR ()
Ответ на: комментарий от NIR

надо было сразу звонить поставщику и ругаться благим матом.
на лицо подмена накопителя, который к тому же еще и сыпаться начинает

Suicide_inc ★★ ()
Ответ на: комментарий от Suicide_inc

Да я работаю-то не так давно. Потому сразу звонить не получилось.

Кстати, на счёт «сыпаться начинает» - это сказано про ошибки ATA в логе? Я просто ещё не научился их читать-разбирать.

NIR ()
Ответ на: комментарий от NIR

197 Current pending sector
на исправном винте должен быть 0. это физический износ поверхности

Suicide_inc ★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.