LINUX.ORG.RU

Как умирает SSD

 , ,


0

3

Тут было много тем про «сколько живут SSD», не являются ли такие то показатели в смарте сигналом к скорой смерти и пр.

Поэтому я решил поделиться своим наблюдением, может кому-то оно и будет полезным или интересным.

Это мой первый SSD диск, который я купил, и который у меня умер, хотя точнее сказать, что он доживает последние дни.

Этот диск у меня появился вместе с ноутбуком Thinkpad x301, который я купил в далеком 2009 году, и с тех пор он очень долго был моей основной рабочей машиной. Только последние несколько лет я сижу на десктопе, но ноут все также активно использовал на работе и на даче.

Нагрузка на диск была разной, были и компиляции системы (с самого начала на нем была Gentoo), и работы с базами данных, и полнодисковое шифрование с перезаписью всего объема. Оперативы на нем всего 8GB и это максимум, который можно поставить, так что диск пользовался только так.

Так вот вчера я заметил, что при включении он начал «тупить»:

dmesg:

[    8.525965] ata2: link is slow to respond, please be patient (ready=0)
[   13.215966] ata2: COMRESET failed (errno=-16)
[   18.585964] ata2: link is slow to respond, please be patient (ready=0)
[   23.275963] ata2: COMRESET failed (errno=-16)
[   28.645962] ata2: link is slow to respond, please be patient (ready=0)
[   55.725969] random: crng init done
[   58.325965] ata2: COMRESET failed (errno=-16)
[   58.328197] ata2: limiting SATA link speed to 1.5 Gbps
[   63.345965] ata2: COMRESET failed (errno=-16)
[   63.348207] ata2: reset failed, giving up

А в smart начал резко расти параметр

233 Media_Wearout_Indicator -O-RCK   001   001   000    -    9556838

полмиллиона добаляется за 20% long selftest’a.

Диск умирает. Он служил верой и правдой с 2009 года, целых 15 лет, большую часть своей жизни работая круглосуточно. Но его время пришло. RIP.

PS: выхлоп smartctl ниже, но к некоторым числам стоит относиться с сомнением, скажем power_on_hours явно уже переполнялись, они сильно меньше того, что фактически было.

=== START OF INFORMATION SECTION ===
Device Model:     SAMSUNG MMCQE28G8MUP-0VA
Serial Number:    SE928A5371
Firmware Version: VAM08L1Q
User Capacity:    128,035,676,160 bytes [128 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
TRIM Command:     Unavailable
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ATA/ATAPI-7 T13/1532D revision 1
Local Time is:    Thu Feb 22 21:48:28 2024 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
AAM feature is:   Unavailable
APM feature is:   Unavailable
Rd look-ahead is: Enabled
Write cache is:   Enabled
DSN feature is:   Unavailable
ATA Security is:  Disabled, frozen [SEC2]
Wt Cache Reorder: Unavailable
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
  9 Power_On_Hours          -O--CK   093   093   000    -    32660
 12 Power_Cycle_Count       -O--CK   097   097   000    -    2873
175 Program_Fail_Count_Chip -O--CK   100   100   011    -    0
176 Erase_Fail_Count_Chip   -O--CK   100   100   011    -    0
177 Wear_Leveling_Count     PO--C-   098   098   023    -    1902
178 Used_Rsvd_Blk_Cnt_Chip  PO--C-   085   085   011    -    18
179 Used_Rsvd_Blk_Cnt_Tot   PO--C-   097   097   010    -    111
180 Unused_Rsvd_Blk_Cnt_Tot PO--C-   097   097   010    -    3793
181 Program_Fail_Cnt_Total  -O--CK   100   100   010    -    0
182 Erase_Fail_Count_Total  -O--CK   100   100   010    -    0
183 Runtime_Bad_Block       PO--C-   100   100   010    -    0
187 Reported_Uncorrect      PO--CK   099   099   000    -    3
195 Hardware_ECC_Recovered  -O-RC-   199   199   000    -    3
198 Offline_Uncorrectable   ----CK   100   100   000    -    0
199 UDMA_CRC_Error_Count    -OSRCK   253   253   000    -    0
233 Media_Wearout_Indicator -O-RCK   001   001   000    -    9556838
234 Unknown_Attribute       -O--C-   100   100   000    -    0
235 Unknown_Attribute       -O--C-   100   100   000    -    0
236 Unknown_Attribute       -O--C-   099   099   000    -    2188
237 Unknown_Attribute       -O--C-   099   099   000    -    2468
238 Unknown_Attribute       -O--C-   100   100   000    -    0
                            ||||||_ K auto-keep
                            |||||__ C event count
                            ||||___ R error rate
                            |||____ S speed/performance
                            ||_____ O updated online
                            |______ P prefailure warning
SMART Extended Comprehensive Error Log Version: 1 (1 sectors)
No Errors Logged

Warning! SMART Extended Self-test Log Structure error: invalid SMART checksum.
SMART Extended Self-test Log Version: 1 (1 sectors)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       80%     32659         79765440
# 2  Extended offline    Completed: read failure       80%     32659         79765440
# 3  Extended offline    Completed: read failure       80%     32659         79765440
# 4  Short offline       Completed without error       00%     29479         -
# 5  Short offline       Completed without error       00%     29311         -
# 6  Short offline       Completed without error       00%     29151         -
# 7  Short offline       Completed without error       00%     28996         -
SATA Phy Event Counters (GP Log 0x11)
ID      Size     Value  Description
0x0001  2            0  Command failed due to ICRC error
0x0002  2            0  R_ERR response for data FIS
0x0003  2            0  R_ERR response for device-to-host data FIS
0x0004  2            0  R_ERR response for host-to-device data FIS
0x0005  2            0  R_ERR response for non-data FIS
0x0006  2            0  R_ERR response for device-to-host non-data FIS
0x0007  2            0  R_ERR response for host-to-device non-data FIS
0x0008  2            0  Device-to-host non-data FIS retries
0x0009  2           21  Transition from drive PhyRdy to drive PhyNRdy
0x000a  2            2  Device-to-host register FISes sent due to a COMRESET
0x000b  2            0  CRC errors within host-to-device FIS
0x000d  2            0  Non-CRC errors within host-to-device FIS
0x000f  2            0  R_ERR response for host-to-device data FIS, CRC
0x0010  2            0  R_ERR response for host-to-device data FIS, non-CRC
0x0012  2            0  R_ERR response for host-to-device non-data FIS, CRC
0x0013  2            0  R_ERR response for host-to-device non-data FIS, non-CRC

PPS:

x301 ~ # hdparm -tT --direct /dev/sda

/dev/sda:
 Timing O_DIRECT cached reads:   212 MB in  2.01 seconds = 105.44 MB/sec
 Timing O_DIRECT disk reads: 314 MB in  3.01 seconds = 104.25 MB/sec
★★★★

Последнее исправление: soomrack (всего исправлений: 3)

У меня Кингстон 2013 года, смарт пишет что здоровье 88%. На всякий случай купил новый, а этот запихал в подсобный ноут, где он будет доживать.

utanho ★★★★★
()
Ответ на: комментарий от greenman

mSATA SSD?

Micro SATA.

TC: Как отметили выше, бывают переходники. По габаритам M.2 to Micro SATA, возможно, поместится. Я тоже в свое время ушатал 1.8" SSD и тоже в своем старом ThinkPad, заменил на Intel S3500. Это было в 2020, тогда они еще выпускались, и нет сомнений, что можно купить и сейчас. Оверпрайс, да.

i586 ★★★★★
()

он доживает последние дни

что бы продлить доживание в fstab нужно errors=remount-ro дописать и тогда оно если что - само себя убивать не будет, я на таком ssd годами еду - может в ro перейти через 3 минуты после включения, а может неделями такое не происходить, нагрузка на винт не сильная и никогда сильной не была, использовалось всегда менее половины пространства, возраст более 10-и лет - 60-и гиговый старикан, но марка хорошая kingston.

amd_amd ★★★★★
()
Ответ на: комментарий от anonymous

uncorrectable errors в смарте «ржавчина на контактах» не даст.

тут можно попробовать пнуть чтение файлов, удалить поврежденный и сделать fstrim. или в целом сделать trim для всей поверхности. может еще поживет немного (запас резервных блоков есть). хотя хранить на нем что-то важное не стоит…

NiTr0 ★★★★★
()
Ответ на: комментарий от NiTr0

Сомневаюсь. Попытка через hdparm перезаписать сбойный LBA на котором падает selftest ни к чему не привела, блок не был перемещен, и selftest все также падает на том же месте.

Ну и в целом, сообщения в dmesg намекают, что проблема не в паре сбойных секторов.

soomrack ★★★★
() автор топика
Последнее исправление: soomrack (всего исправлений: 1)
Ответ на: комментарий от NiTr0

ничем не лучше

ты не догоняешь это тот еще кингстон - сейчас таких кингстонов уже не делают, а уж гудрамов и подавно

amd_amd ★★★★★
()
Последнее исправление: amd_amd (всего исправлений: 1)
Ответ на: комментарий от soomrack

навесами-радиаторами

это да - весит он нормально по сравнению с современными несмотря на одинаковые габариты https://www.dns-shop.ru/product/f6603b7dbc72615e/tverdotelnyj-nakopitel-ssd-25-sata-3-60gb-kingston-v300-sv300s37a60g-sf-2281-r450w450mbs/

amd_amd ★★★★★
()
Ответ на: комментарий от anonymous

Не знаю, не анализировал. Скорее всего с доп. фичами, типа шифрования, бекапов, переноса инфы и пр. функционала для конечного виндо-пользователя, а также с интеграцией для спец. утилит.

soomrack ★★★★
() автор топика
Ответ на: комментарий от amd_amd

хоть «тот», хоть «не тот» - кингстон обычный дешманширпотреб, с рандомной начинкой и конским оверпрайсом за маркетинг. ничуть не лучше условной адаты/апасера…

NiTr0 ★★★★★
()
Ответ на: комментарий от soomrack

нет там своей прошивки.

покупают память (корпусируют правда самостоятельно), покупают контроллер, покупают прошивку. лепят свистоперделки и напаривают втридорога.

NiTr0 ★★★★★
()
Ответ на: комментарий от NiTr0

Давным-давно вроде бы была…

Но так то да, зачем напрягаться если ты 100% зависишь от производителя (которых два) и они могут тебя «закрыть» в любой момент. Все в итоге приходит к тому, что непроизводитель работает только с упаковкой и маркетингом.

Все очень логично.

Samsung производит память. При производстве случается брак. Брак можно выкинуть (невыгодно), можно продать (выгодно). Но продавать брак под своим брендом нельзя, это плохо сказывается на репутации и соотв. стоимости товара. Поэтому продать надо кому-то другому. Покупают совсем-совсем брак те, кому свой бренд не жалко, это бренды «однодневки». Просто брак купят вот всякие кингстоны и пр, которые дадут меньшую гарантию, уменьшат скорость работы, красиво завернут и продадут уже потребителю.

Поэтому покупать лучше продукцию брендированную производителем.

Еще правда есть вариант ентерпрайза, когда интел покупает, и соотв. требует высокого качества, может даже сильно выше, обычного, потом под своим брендом продает дальше. Но это получается сильный оверпрайс, который оправдан только в ентерпрайзе, где фин.ответственность по цепочке, интеграция и пр.

soomrack ★★★★
() автор топика
Ответ на: комментарий от amd_amd

Аналогично, но чуть лучше, т.к. это «дочка» (с некоторых пор) Toshiba, а тошиба производит ssd память.

PS: Samsung, Toshiba и Micron – основные производители, соотв. лучше покупать диски под их брендами.

soomrack ★★★★
() автор топика
Последнее исправление: soomrack (всего исправлений: 2)
Ответ на: комментарий от amd_amd

еще хуже)))

30+% гарантийных возвратов у самых фейловых серий (тех что на сэндфорсе). потому собссно и обанкротились…

NiTr0 ★★★★★
()
Последнее исправление: NiTr0 (всего исправлений: 1)
Ответ на: комментарий от NiTr0

Это теперь, наверное.

Думаю, что тошиба увидела, что аудитория хорошая и купила бренд. А потом начала его использовать для реализации брака, а качественный товар продавать под своим брендом.

soomrack ★★★★
() автор топика
Ответ на: комментарий от NiTr0

Мне казалось, что они догоняющие в плане технологий. И доля рынка у них весьма маленькая. А WD просто пытается не отстать от SSD, основной сегмент у них это HDD, которым тоже SSD приклеивают с некоторых пор.

soomrack ★★★★
() автор топика
Ответ на: комментарий от soomrack

wd купили sandisk и производят память и вроде даже контроллеры. потому получше будут чем условная адата/кингстон (а тем более смартбэй). хоть как по мне оверпрайс неадекватный за бренд.

NiTr0 ★★★★★
()
Ответ на: комментарий от NiTr0

А, интересно. Ну значит, сразу продавали отбраковку, а когда прогорели, то тошиба помогла, т.к. брак все равно продавать надо, дешевле помочь деньгами, чем новый бренд делать и аудиторию собирать, опять же акции подросли, наверное, на этом.

soomrack ★★★★
() автор топика
Ответ на: комментарий от NiTr0

Ага. Прыгнули в уходящий поезд.

Последние 10 лет я придерживался стратегии, что HDD покупаю от WD хороших серий (много лет это уже только Gold), а SSD от Samsung. Пока ни разу не пожалел, и каких-то изменений на горизонте тоже не видно.

soomrack ★★★★
() автор топика
Ответ на: комментарий от soomrack

обанкротились они, а не тошиба помогла. тошиба купила их, в основном ради разработок (свой контроллер) а не ради бренда (который из-за любви к продаже явных какашек шел ко дну).

NiTr0 ★★★★★
()
Ответ на: комментарий от soomrack

жесткие у WD - такое себе… контакты на плате посребренные, флюс не отмыт - итог сгнивают лет за 5. 5400 винты у них изначально печальные по надежности. в десктопных по маркетинговым соображениям рубят SCT ERC - чтобы рэйдовые покупали.

тошиба (которые хитачи в девичестве) куда приятнее в этом плане.

NiTr0 ★★★★★
()
Ответ на: комментарий от NiTr0

Я имел ввиду, что тошиба помогла им выжить, но уже, как часть тошибы.

Взяли команду, разработки по контроллеру, аудиторию, но бренд не закрыли, а продолжают использовать, и продают SSD диски OCZ, и в то же время, продают SSD диски Toshiba. На мой взгляд, это выглядит как продажа отбраковки.

soomrack ★★★★
() автор топика
Ответ на: комментарий от NiTr0

Не знаю. У меня Gold еще ни один не сдох, хотя работают 24/7/365 несколько лет, есть даже один диск из 00х годов..

Но другие серии – да, печально известные WD Green (первые серии), WD Blue тоже не порадовали. Поэтому я смотрю на сроки гарантии и инфу про нагрузку в даташитах.

soomrack ★★★★
() автор топика
Ответ на: комментарий от soomrack

а как повезет. у wd эдак 2005-2008 годов вообще жопа была с флюсом, переходные отверстия на платах сгнивали даже, и чипы гнили, временно оживая после прогрева феном…

ну а сроки гарантии не говорят ни о чем - ну кроме того, что стоимость гарантийной замены за этот период включена в ценник.

а так-то хитачи/тошибы со 80+к часов наработки вполне есть в хозяйстве…

NiTr0 ★★★★★
()