Тут было много тем про «сколько живут SSD», не являются ли такие то показатели в смарте сигналом к скорой смерти и пр.
Поэтому я решил поделиться своим наблюдением, может кому-то оно и будет полезным или интересным.
Это мой первый SSD диск, который я купил, и который у меня умер, хотя точнее сказать, что он доживает последние дни.
Этот диск у меня появился вместе с ноутбуком Thinkpad x301, который я купил в далеком 2009 году, и с тех пор он очень долго был моей основной рабочей машиной. Только последние несколько лет я сижу на десктопе, но ноут все также активно использовал на работе и на даче.
Нагрузка на диск была разной, были и компиляции системы (с самого начала на нем была Gentoo), и работы с базами данных, и полнодисковое шифрование с перезаписью всего объема. Оперативы на нем всего 8GB и это максимум, который можно поставить, так что диск пользовался только так.
Так вот вчера я заметил, что при включении он начал «тупить»:
dmesg:
[    8.525965] ata2: link is slow to respond, please be patient (ready=0)
[   13.215966] ata2: COMRESET failed (errno=-16)
[   18.585964] ata2: link is slow to respond, please be patient (ready=0)
[   23.275963] ata2: COMRESET failed (errno=-16)
[   28.645962] ata2: link is slow to respond, please be patient (ready=0)
[   55.725969] random: crng init done
[   58.325965] ata2: COMRESET failed (errno=-16)
[   58.328197] ata2: limiting SATA link speed to 1.5 Gbps
[   63.345965] ata2: COMRESET failed (errno=-16)
[   63.348207] ata2: reset failed, giving up
А в smart начал резко расти параметр
233 Media_Wearout_Indicator -O-RCK   001   001   000    -    9556838
полмиллиона добаляется за 20% long selftest’a.
Диск умирает. Он служил верой и правдой с 2009 года, целых 15 лет, большую часть своей жизни работая круглосуточно. Но его время пришло. RIP.
PS: выхлоп smartctl ниже, но к некоторым числам стоит относиться с сомнением, скажем power_on_hours явно уже переполнялись, они сильно меньше того, что фактически было.
=== START OF INFORMATION SECTION ===
Device Model:     SAMSUNG MMCQE28G8MUP-0VA
Serial Number:    SE928A5371
Firmware Version: VAM08L1Q
User Capacity:    128,035,676,160 bytes [128 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
TRIM Command:     Unavailable
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ATA/ATAPI-7 T13/1532D revision 1
Local Time is:    Thu Feb 22 21:48:28 2024 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
AAM feature is:   Unavailable
APM feature is:   Unavailable
Rd look-ahead is: Enabled
Write cache is:   Enabled
DSN feature is:   Unavailable
ATA Security is:  Disabled, frozen [SEC2]
Wt Cache Reorder: Unavailable
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  9 Power_On_Hours          -O--CK   093   093   000    -    32660
 12 Power_Cycle_Count       -O--CK   097   097   000    -    2873
175 Program_Fail_Count_Chip -O--CK   100   100   011    -    0
176 Erase_Fail_Count_Chip   -O--CK   100   100   011    -    0
177 Wear_Leveling_Count     PO--C-   098   098   023    -    1902
178 Used_Rsvd_Blk_Cnt_Chip  PO--C-   085   085   011    -    18
179 Used_Rsvd_Blk_Cnt_Tot   PO--C-   097   097   010    -    111
180 Unused_Rsvd_Blk_Cnt_Tot PO--C-   097   097   010    -    3793
181 Program_Fail_Cnt_Total  -O--CK   100   100   010    -    0
182 Erase_Fail_Count_Total  -O--CK   100   100   010    -    0
183 Runtime_Bad_Block       PO--C-   100   100   010    -    0
187 Reported_Uncorrect      PO--CK   099   099   000    -    3
195 Hardware_ECC_Recovered  -O-RC-   199   199   000    -    3
198 Offline_Uncorrectable   ----CK   100   100   000    -    0
199 UDMA_CRC_Error_Count    -OSRCK   253   253   000    -    0
233 Media_Wearout_Indicator -O-RCK   001   001   000    -    9556838
234 Unknown_Attribute       -O--C-   100   100   000    -    0
235 Unknown_Attribute       -O--C-   100   100   000    -    0
236 Unknown_Attribute       -O--C-   099   099   000    -    2188
237 Unknown_Attribute       -O--C-   099   099   000    -    2468
238 Unknown_Attribute       -O--C-   100   100   000    -    0
                            ||||||_ K auto-keep
                            |||||__ C event count
                            ||||___ R error rate
                            |||____ S speed/performance
                            ||_____ O updated online
                            |______ P prefailure warning
SMART Extended Comprehensive Error Log Version: 1 (1 sectors)
No Errors Logged
Warning! SMART Extended Self-test Log Structure error: invalid SMART checksum.
SMART Extended Self-test Log Version: 1 (1 sectors)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       80%     32659         79765440
# 2  Extended offline    Completed: read failure       80%     32659         79765440
# 3  Extended offline    Completed: read failure       80%     32659         79765440
# 4  Short offline       Completed without error       00%     29479         -
# 5  Short offline       Completed without error       00%     29311         -
# 6  Short offline       Completed without error       00%     29151         -
# 7  Short offline       Completed without error       00%     28996         -
SATA Phy Event Counters (GP Log 0x11)
ID      Size     Value  Description
0x0001  2            0  Command failed due to ICRC error
0x0002  2            0  R_ERR response for data FIS
0x0003  2            0  R_ERR response for device-to-host data FIS
0x0004  2            0  R_ERR response for host-to-device data FIS
0x0005  2            0  R_ERR response for non-data FIS
0x0006  2            0  R_ERR response for device-to-host non-data FIS
0x0007  2            0  R_ERR response for host-to-device non-data FIS
0x0008  2            0  Device-to-host non-data FIS retries
0x0009  2           21  Transition from drive PhyRdy to drive PhyNRdy
0x000a  2            2  Device-to-host register FISes sent due to a COMRESET
0x000b  2            0  CRC errors within host-to-device FIS
0x000d  2            0  Non-CRC errors within host-to-device FIS
0x000f  2            0  R_ERR response for host-to-device data FIS, CRC
0x0010  2            0  R_ERR response for host-to-device data FIS, non-CRC
0x0012  2            0  R_ERR response for host-to-device non-data FIS, CRC
0x0013  2            0  R_ERR response for host-to-device non-data FIS, non-CRC
PPS:
x301 ~ # hdparm -tT --direct /dev/sda
/dev/sda:
 Timing O_DIRECT cached reads:   212 MB in  2.01 seconds = 105.44 MB/sec
 Timing O_DIRECT disk reads: 314 MB in  3.01 seconds = 104.25 MB/sec






