LINUX.ORG.RU

Тошибовский HDD — сбой или «особенности»?

 , ,


0

2

Сегодня при загрузке доблестный гноме сообщил, что всё пропало и Seek Error Rate зашкаливает. Через часок параметр стал больше трешолда, правда. Прогнал селф-тесты (short и long), но они вроде как завершаются с ошибкой (не проверял, было ли такое поведение при «здоровом» диске).

Железо: диск Toshiba X300 14TB HDWG31E, матплата MSI PRO Z690-A (диск в нее воткнут).

Вот что говорит smartctl:

% sudo smartctl -A /dev/sda
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-6.0.15] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   050    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0027   100   100   001    Pre-fail  Always       -       8022
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       220
  5 Reallocated_Sector_Ct   0x0033   100   100   050    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   051   049   050    Pre-fail  Always   In_the_past 0
  8 Seek_Time_Performance   0x0005   100   100   050    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0032   093   093   000    Old_age   Always       -       2906
 10 Spin_Retry_Count        0x0033   100   100   030    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       218
 23 Unknown_Attribute       0x0023   100   100   075    Pre-fail  Always       -       0
 24 Unknown_Attribute       0x0023   100   100   075    Pre-fail  Always       -       0
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       6
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       652
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       31 (Min/Max 18/52)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
220 Disk_Shift              0x0002   100   100   000    Old_age   Always       -       117571588
222 Loaded_Hours            0x0032   096   096   000    Old_age   Always       -       1660
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
224 Load_Friction           0x0022   100   100   000    Old_age   Always       -       0
226 Load-in_Time            0x0026   100   100   000    Old_age   Always       -       531
240 Head_Flying_Hours       0x0001   100   100   001    Pre-fail  Offline      -       0
% sudo smartctl -l selftest /dev/sda
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-6.0.15] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: unknown failure    90%      2904         0
# 2  Short offline       Completed: unknown failure    90%      2904         0
# 3  Short offline       Completed: unknown failure    90%      2904         0

Бэкапы сделал сразу. Нужно ли бежать в магазин за новым (не особо хочется, т.к. дороха), или это «особенности» тошиб?

★★★

моя тошиба

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   050    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0027   100   100   001    Pre-fail  Always       -       9052
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       90
  5 Reallocated_Sector_Ct   0x0033   100   100   050    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   050    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   050    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0032   061   061   000    Old_age   Always       -       15968
 10 Spin_Retry_Count        0x0033   101   100   030    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       90
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       1
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       7
193 Load_Cycle_Count        0x0032   085   085   000    Old_age   Always       -       154261
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       20 (Min/Max 14/41)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   253   000    Old_age   Always       -       0
220 Disk_Shift              0x0002   100   100   000    Old_age   Always       -       0
222 Loaded_Hours            0x0032   077   077   000    Old_age   Always       -       9505
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
224 Load_Friction           0x0022   100   100   000    Old_age   Always       -       0
226 Load-in_Time            0x0026   100   100   000    Old_age   Always       -       889
240 Head_Flying_Hours       0x0001   100   100   001    Pre-fail  Offline      -       0

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      5290         -
# 2  Short offline       Completed without error       00%         2         -

Ros ★★★★
()
Последнее исправление: Ros (всего исправлений: 2)
Ответ на: комментарий от DumLemming

В мониторинг не записывал, но по оценкам на глаз и smartctl -x, там в среднем 30-35°C, с пиками до 40°C (с нагруженными процессором и GPU). Диск всё равно используется в основном как пассивный сторедж.

lu4nik ★★★
() автор топика
Ответ на: комментарий от sparks

Не очень понятна связь, у меня не было проблем с парковкой. Редко бывают фризы всей системы при активном I/O именно на жесткий диск (не 12309, то же самое в винде наблюдается), но мне в целом насрать на это. Тут вопрос в работоспособности в целом.

lu4nik ★★★
() автор топика
Ответ на: комментарий от lu4nik

Там дело было не в парковке, ну в некотором роде в ней тоже, но это скорее сторонний топик, прошивка начала творить какуюто ерунду, после сброса, винт ожил

sparks ★★★
()