LINUX.ORG.RU

Диску пришёл пушистый?

 , ,


0

1

В LVM группе, на шаре, есть диск от Seagate Video 3.5 HDD на 2ТБ. Сегодня начала отваливается шара (самба). В SMART такая картина:

  1 Raw_Read_Error_Rate     0x000f   108   099   006    Pre-fail  Always       -       18883056
  3 Spin_Up_Time            0x0003   096   095   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   098   098   020    Old_age   Always       -       2226
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   073   060   030    Pre-fail  Always       -       21540628
  9 Power_On_Hours          0x0032   075   075   000    Old_age   Always       -       22316
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       548
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   001   001   000    Old_age   Always       -       198
190 Airflow_Temperature_Cel 0x0022   066   056   045    Old_age   Always       -       34 (Min/Max 21/38)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       188
193 Load_Cycle_Count        0x0032   099   099   000    Old_age   Always       -       2226
194 Temperature_Celsius     0x0022   034   044   000    Old_age   Always       -       34 (0 15 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

Чутьё мне подсказывает что пора распечатывать несчастную кредитку и идти за новым диском.

Может питания не хватать, может быть индивидуальная непереносимость контроллером или жарко ему.

Так в смарте тупо ошибки, его бы отдельно взять да потыкать тестами.

Deleted
()

Двухтеррабайтники не дорогие ныне, я покупал.

burato ★★★★★
()

Проверь питание и шлейфы. Смарт в общем не плох

r0ck3r ★★★★★
()
Ответ на: комментарий от FluffyPillow

Для Seagate они ничего не значат

Deleted
()
Ответ на: комментарий от FluffyPillow

Вот тебе с живого диска:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   109   099   006    Pre-fail  Always       -       24189688
  3 Spin_Up_Time            0x0003   096   096   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   097   097   020    Old_age   Always       -       3144
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   081   060   030    Pre-fail  Always       -       127462503
  9 Power_On_Hours          0x0032   078   078   000    Old_age   Always       -       19743
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   020    Old_age   Always       -       3146
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   088   088   099    Old_age   Always   FAILING_NOW 12
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       0 0 9
189 High_Fly_Writes         0x003a   098   098   000    Old_age   Always       -       2
190 Airflow_Temperature_Cel 0x0022   061   057   045    Old_age   Always       -       39 (Min/Max 28/39)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       236
193 Load_Cycle_Count        0x0032   090   090   000    Old_age   Always       -       21778
194 Temperature_Celsius     0x0022   039   043   000    Old_age   Always       -       39 (0 14 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       85
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       18508h+10m+39.571s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       24880551424
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       33909343181

вот еще один сигейт

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   119   096   006    Pre-fail  Always       -       227664486
  3 Spin_Up_Time            0x0003   096   095   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   098   098   020    Old_age   Always       -       2667
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   078   060   030    Pre-fail  Always       -       17506383109
  9 Power_On_Hours          0x0032   033   033   000    Old_age   Always       -       59250
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   098   098   020    Old_age   Always       -       2759
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   055   051   045    Old_age   Always       -       45 (Min/Max 29/47)
194 Temperature_Celsius     0x0022   045   049   000    Old_age   Always       -       45 (0 17 0 0 0)
195 Hardware_ECC_Recovered  0x001a   071   058   000    Old_age   Always       -       234669185
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 Data_Address_Mark_Errs  0x0032   100   253   000    Old_age   Always       -       0

пугайся

Deleted
()
Последнее исправление: Deleted (всего исправлений: 1)
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0

Нормальный смарт же. Причина в другом, скорее всего.

Deleted
()
Ответ на: комментарий от greenman
[78142.880540] perf: interrupt took too long (2522 > 2500), lowering kernel.perf_event_max_sample_rate to 79250
[110531.330051] perf: interrupt took too long (3155 > 3152), lowering kernel.perf_event_max_sample_rate to 63250
[168255.076541] perf: interrupt took too long (3949 > 3943), lowering kernel.perf_event_max_sample_rate to 50500

Когда отваливается диск - вешается вся система. Я не знаю что из этого причина, а что следствие.

FluffyPillow
() автор топика
Ответ на: комментарий от greenman

Тогда больше ничего подозрительного в dmesg нет.

FluffyPillow
() автор топика
Ответ на: комментарий от FluffyPillow

А 1 и 7 аттрибут?

Для seagate высокие значения в этих полях ни чего не значат.

SergeySVold ★★★★
()
Ответ на: комментарий от anonymous

Первый? Там диск-пылесос, из той серии где сигейт прокладку не той формы поставил, на хабре умельцы даже описывали как предотвратить его смерть (https://habr.com/post/251941/).

Но тут он пока работает, тем более что не мой и файло на нём не моё, да и владельцу он не нужен особо.

Deleted
()
Последнее исправление: Deleted (всего исправлений: 1)
Ответ на: комментарий от FluffyPillow

perf: interrupt took too long (2522 > 2500), lowering >kernel.perf_event_max_sample_rate to 79250

Ну если хочешь это убрать то смотри kernel/perf_event_max_sample_rate — параметр sysctl, определяет максимальную частоту дискретизации - по умолчанию 100000. А так я бы шлейф на диск поменял.

SergeySVold ★★★★
()

Аффтар - мудак.

С винтом всё в порядке.

anonymous
()
Ответ на: комментарий от FluffyPillow

Миллион раз говорил уже на ЛОРе, что нельзя смотреть на RAW_VALUE. Ещё раз напомню:

Raw_Read_Error_Rate — Vendor specific raw value. The raw value has different structure for different vendors and is often not meaningful as a decimal number

redgremlin ★★★★★
()

Релоков нет, температура нормальная. Проверяй SATA-кабель. Сначала просто переподключи на выключенном компе (окислы на контактах). Если не поможет, то меняешь. Их сейчас из говна делают, так что вполне мог стать причиной.

Попробуй найти кабель с защелками, они обычно лучше держатся.

Radjah ★★★★★
()

Нормальный смарт для сигейта

Black_Shadow ★★★★★
()
Ответ на: комментарий от FluffyPillow

Не надо ничего смотреть, в 1 и 7 аттрибут у сигейтов не надо вообще рассматривать как сбойный.

Deleted
()
Ответ на: комментарий от Deleted

Здравствуйте, кот Матроскин!

Здравствуйте, кот Леопольд!

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.