LINUX.ORG.RU

SSD мёртв? Советы по выбору SSD.

 


1

3

Дело было вечером... потух экран и всё повисло. После перезапуска попадаю в консоль. Пишет, что корень в read-only. Корень на SSD, которому уже 4.5 года. Видимо пришло его время.

dmesg:

[   85.992031] ata1.00: exception Emask 0x10 SAct 0xfc0000 SErr 0x400100 action 0x6 frozen
[   85.992035] ata1.00: irq_stat 0x08000000, interface fatal error
[   85.992038] ata1: SError: { UnrecovData Handshk }
[   85.992042] ata1.00: failed command: WRITE FPDMA QUEUED
[   85.992050] ata1.00: cmd 61/08:90:08:70:07/00:00:00:00:00/40 tag 18 ncq dma 4096 out
                        res 40/00:b8:b0:8d:87/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[   85.992052] ata1.00: status: { DRDY }
[   85.992054] ata1.00: failed command: WRITE FPDMA QUEUED
[   85.992061] ata1.00: cmd 61/08:98:a0:90:07/00:00:00:00:00/40 tag 19 ncq dma 4096 out
                        res 40/00:b8:b0:8d:87/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[   85.992062] ata1.00: status: { DRDY }
[   85.992064] ata1.00: failed command: WRITE FPDMA QUEUED
[   85.992070] ata1.00: cmd 61/08:a0:48:c6:07/00:00:00:00:00/40 tag 20 ncq dma 4096 out
                        res 40/00:b8:b0:8d:87/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[   85.992072] ata1.00: status: { DRDY }
[   85.992074] ata1.00: failed command: WRITE FPDMA QUEUED
[   85.992080] ata1.00: cmd 61/08:a8:80:d7:07/00:00:00:00:00/40 tag 21 ncq dma 4096 out
                        res 40/00:b8:b0:8d:87/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[   85.992082] ata1.00: status: { DRDY }
[   85.992084] ata1.00: failed command: WRITE FPDMA QUEUED
[   85.992090] ata1.00: cmd 61/08:b0:30:0c:09/00:00:00:00:00/40 tag 22 ncq dma 4096 out
                        res 40/00:b8:b0:8d:87/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[   85.992091] ata1.00: status: { DRDY }
[   85.992093] ata1.00: failed command: WRITE FPDMA QUEUED
[   85.992099] ata1.00: cmd 61/08:b8:b0:8d:87/00:00:00:00:00/40 tag 23 ncq dma 4096 out
                        res 40/00:b8:b0:8d:87/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[   85.992101] ata1.00: status: { DRDY }
[   85.992105] ata1: hard resetting link
[   86.306181] ata1: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[   86.314352] ACPI Error: [DSSP] Namespace lookup failure, AE_NOT_FOUND (20170831/psargs-364)
[   86.314361] ACPI Error: Method parse/execution failed \_SB.PCI0.SAT0.SPT0._GTF, AE_NOT_FOUND (20170831/psparse-550)
[   86.324326] ACPI Error: [DSSP] Namespace lookup failure, AE_NOT_FOUND (20170831/psargs-364)
[   86.324333] ACPI Error: Method parse/execution failed \_SB.PCI0.SAT0.SPT0._GTF, AE_NOT_FOUND (20170831/psparse-550)
[   86.325098] ata1.00: configured for UDMA/133
[   86.325127] ata1: EH complete
[   87.016024] ata1.00: exception Emask 0x10 SAct 0x40000 SErr 0x400100 action 0x6 frozen
[   87.016026] ata1.00: irq_stat 0x08000000, interface fatal error
[   87.016029] ata1: SError: { UnrecovData Handshk }
[   87.016034] ata1.00: failed command: WRITE FPDMA QUEUED
[   87.016040] ata1.00: cmd 61/20:90:a0:7d:0b/00:00:01:00:00/40 tag 18 ncq dma 16384 out
                        res 40/00:90:a0:7d:0b/00:00:01:00:00/40 Emask 0x10 (ATA bus error)
[   87.016042] ata1.00: status: { DRDY }
[   87.016046] ata1: hard resetting link
[   87.330176] ata1: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[   87.340372] ACPI Error: [DSSP] Namespace lookup failure, AE_NOT_FOUND (20170831/psargs-364)
[   87.340379] ACPI Error: Method parse/execution failed \_SB.PCI0.SAT0.SPT0._GTF, AE_NOT_FOUND (20170831/psparse-550)
[   87.350365] ACPI Error: [DSSP] Namespace lookup failure, AE_NOT_FOUND (20170831/psargs-364)
[   87.350371] ACPI Error: Method parse/execution failed \_SB.PCI0.SAT0.SPT0._GTF, AE_NOT_FOUND (20170831/psparse-550)
[   87.351139] ata1.00: configured for UDMA/133
[   87.351152] ata1: EH complete
[   87.351586] ata1.00: exception Emask 0x10 SAct 0x200000 SErr 0x400100 action 0x6 frozen
[   87.351587] ata1.00: irq_stat 0x08000000, interface fatal error
[   87.351588] ata1: SError: { UnrecovData Handshk }
[   87.351590] ata1.00: failed command: WRITE FPDMA QUEUED
[   87.351593] ata1.00: cmd 61/20:a8:a0:7d:0b/00:00:01:00:00/40 tag 21 ncq dma 16384 out
                        res 40/00:a8:a0:7d:0b/00:00:01:00:00/40 Emask 0x10 (ATA bus error)
[   87.351594] ata1.00: status: { DRDY }
[   87.351596] ata1: hard resetting link
[   87.666189] ata1: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
[   87.676335] ACPI Error: [DSSP] Namespace lookup failure, AE_NOT_FOUND (20170831/psargs-364)
[   87.676342] ACPI Error: Method parse/execution failed \_SB.PCI0.SAT0.SPT0._GTF, AE_NOT_FOUND (20170831/psparse-550)
[   87.686333] ACPI Error: [DSSP] Namespace lookup failure, AE_NOT_FOUND (20170831/psargs-364)
[   87.686339] ACPI Error: Method parse/execution failed \_SB.PCI0.SAT0.SPT0._GTF, AE_NOT_FOUND (20170831/psparse-550)
[   87.687107] ata1.00: configured for UDMA/133
[   87.687119] ata1: EH complete
[   91.112026] ata1: limiting SATA link speed to 3.0 Gbps
[   91.112030] ata1.00: exception Emask 0x10 SAct 0xf SErr 0x400100 action 0x6 frozen
[   91.112031] ata1.00: irq_stat 0x08000000, interface fatal error
[   91.112034] ata1: SError: { UnrecovData Handshk }
[   91.112036] ata1.00: failed command: WRITE FPDMA QUEUED
[   91.112043] ata1.00: cmd 61/28:00:00:b0:83/00:00:00:00:00/40 tag 0 ncq dma 20480 out
                        res 40/00:18:38:c0:83/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[   91.112044] ata1.00: status: { DRDY }
[   91.112047] ata1.00: failed command: WRITE FPDMA QUEUED
[   91.112053] ata1.00: cmd 61/40:08:30:b0:83/00:00:00:00:00/40 tag 1 ncq dma 32768 out
                        res 40/00:18:38:c0:83/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[   91.112054] ata1.00: status: { DRDY }
[   91.112056] ata1.00: failed command: WRITE FPDMA QUEUED
[   91.112062] ata1.00: cmd 61/08:10:10:b1:83/00:00:00:00:00/40 tag 2 ncq dma 4096 out
                        res 40/00:18:38:c0:83/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[   91.112064] ata1.00: status: { DRDY }
[   91.112066] ata1.00: failed command: WRITE FPDMA QUEUED
[   91.112072] ata1.00: cmd 61/40:18:38:c0:83/00:00:00:00:00/40 tag 3 ncq dma 32768 out
                        res 40/00:18:38:c0:83/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[   91.112073] ata1.00: status: { DRDY }
[   91.112079] ata1: hard resetting link
[   91.426181] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
[   91.434360] ACPI Error: [DSSP] Namespace lookup failure, AE_NOT_FOUND (20170831/psargs-364)
[   91.434368] ACPI Error: Method parse/execution failed \_SB.PCI0.SAT0.SPT0._GTF, AE_NOT_FOUND (20170831/psparse-550)
[   91.444352] ACPI Error: [DSSP] Namespace lookup failure, AE_NOT_FOUND (20170831/psargs-364)
[   91.444358] ACPI Error: Method parse/execution failed \_SB.PCI0.SAT0.SPT0._GTF, AE_NOT_FOUND (20170831/psparse-550)
[   91.445126] ata1.00: configured for UDMA/133
[   91.445148] ata1: EH complete

SATA 2 - это проверял входы.

SMART:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       0
  9 Power_On_Hours_and_Msec 0x0032   000   000   000    Old_age   Always       -       918778h+27m+32.720s
 12 Power_Cycle_Count       0x0032   098   098   000    Old_age   Always       -       2796
170 Available_Reservd_Space 0x0033   100   100   010    Pre-fail  Always       -       0
171 Program_Fail_Count      0x0032   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   Always       -       2794
184 End-to-End_Error        0x0033   100   100   090    Pre-fail  Always       -       0
187 Uncorrectable_Error_Cnt 0x000f   120   120   050    Pre-fail  Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       2794
225 Host_Writes_32MiB       0x0032   100   100   000    Old_age   Always       -       149228
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       65535
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       53
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       65535
232 Available_Reservd_Space 0x0033   100   100   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   100   100   000    Old_age   Always       -       0
241 Host_Writes_32MiB       0x0032   100   100   000    Old_age   Always       -       149228
242 Host_Reads_32MiB        0x0032   100   100   000    Old_age   Always       -       172337
249 NAND_Writes_1GiB        0x0013   100   100   000    Pre-fail  Always       -       7201

Судя по всему - дело плохо.

SSD, последний раз, выбрал лет 5 назад, не слежу за ними. Какой поcоветует лор? Гугл предлагает брать Samsung 860 PRO (текущий - Intel 520). Разьем только SATA.

PRO имеет смысл брать только если ты рассчитываешь пользоваться уже покойным SATA более пяти лет. Гарантийный ресурс с EVO у них одинаковый.

anonymous ()

9 Power_On_Hours_and_Msec 0x0032 000 000 000 Old_age Always - 918778h+27m+32.720s

100 лет?!

В смарте ничего особо криминального, переназначений блоков даже нет. Но возможно контроллер сдох.

Jefail ★★★★ ()

860 EVO хватит

Судя по всему - дело плохо

Судя по всему, smart работает так, что не работает

anonymous ()
Ответ на: комментарий от anonymous

уже покойным SATA

Вы про мою материнку или про сам разъем? Я вижу что M2/PCI довольно популярны, но первого у меня нет, а второй стоит как самолёт.

RazrFalcon ★★★★★ ()

Главное SSD не выкидывай - я серъёзно.

Отдай сосёду, у котрого венда, у него заработает.

anonymous ()
Ответ на: комментарий от RazrFalcon

Про сам протокол. Я, конечно, преувеличиваю, но что потребительский, что серверный сегменты действительно потихоньку уходят от SATA.

Из двух потребительских самсунгов выбирать можно тупо по гарантийному сроку.

anonymous ()
Ответ на: комментарий от Jefail

100 лет?!

Многих SSD в hwdb нет, потому такие весёлые вещи бывают.

r3lgar ★★★★★ ()

Если интерпретировать «дословно»

Host_Writes_32MiB 149228

32*149228 = 4 775 296

т.е. ~4.8 TB

NAND_Writes_1GiB 7201

7.2 TB

т.е.

Write amplification ~1.5

И 7.2 TB — это ничто для диска на 100 GB.

Объём диска какой?
Значения смарта с новым кабелем теже самые?

greenman ★★★★★ ()
Последнее исправление: greenman (всего исправлений: 2)
Ответ на: комментарий от greenman

60ГБ. Диску, как оказалось, 5 лет уже.

С другим кабелем уже 2 часа аптайм. Хз что это было.

Сейчас запустил self-test=long на 48 мин. Жду.

RazrFalcon ★★★★★ ()
Ответ на: комментарий от RazrFalcon

Диску, как оказалось, 5 лет уже.

Бережёшь ресурс. Диск, наверняка, только под корень, даже /var, небось, вынес, не так?

60ГБ

Если записано 7.2 TB — то это 120 записей на ячейку. Очень мало.

greenman ★★★★★ ()
Ответ на: комментарий от greenman

Ага. Куча симлинков и tmpfs. Когда покупал - пугали, что через пару лет сдохнет.

Хотя хомяк не выносил.

RazrFalcon ★★★★★ ()
Последнее исправление: RazrFalcon (всего исправлений: 1)

Поменял кабель - пока жив.

В любом случае купил 860 evo. Не помешает.

RazrFalcon ★★★★★ ()
Ответ на: комментарий от RazrFalcon

Для того, что бы вернуться к «начальному» состоянию диска, надо

https://wiki.archlinux.org/index.php/Solid_State_Drive/Memory_cell_clearing

Write performance is known to degrade over time even on SSDs with native TRIM support.

(Все твои файлы будут безвозвратно уничтожены, надеюсь, понимаешь.)

greenman ★★★★★ ()
Последнее исправление: greenman (всего исправлений: 1)
Ответ на: комментарий от greenman

Этот тест я делал уже после форматирования. Сейчас ещё и это попробую.

RazrFalcon ★★★★★ ()
Ответ на: комментарий от RazrFalcon

Как аргументирует?

Можно попробовать

# blkdiscard /dev/sdx

и оставить диск в покое минут на 20 (с питанием), дабы он ячейки почистил.

greenman ★★★★★ ()
Ответ на: комментарий от i-rinat
discard
              Disable/enable the discard mount option.  The discard function issues frequent commands to let  the  block  device
              reclaim  space  freed  by  the  filesystem.   This  is useful for SSD devices, thinly provisioned LUNs and virtual
              machine images, but may have a significant performance impact.  (The fstrim command is also available to  initiate
              batch trims from userspace.)

В чём разница? С точки зрения ядра вроде бы одно и то же.

anonymous ()
Ответ на: комментарий от anonymous

В чём разница?

В том, что fstrim обрабатывает TRIM'ами всё свободное место, которое есть, а опция discard делает «reclaim space freed by the filesystem». Чтобы гарантированно покрыть TRIM'ами всё доступное свободное место, нужно сначала насоздавать файлов, а потом их удалить. Проще и быстрее один раз fstrim вручную запустить.

i-rinat ★★★★★ ()
Ответ на: комментарий от i-rinat

А, ну это понятно. Я думал, ты про какую-то разницу внутри. Тоже запускаю fstrim раз в несколько месяцев для профилактики, а опцию монтирования не использую.

anonymous ()

для начала попробуй провод sata поменять. в smart вроде криминала кроме кривой наработки не видно.

Dark_SavanT ★★★★★ ()
Ответ на: комментарий от greenman

Уже нашел. Правда у меня он за пару минут справился.

RazrFalcon ★★★★★ ()
Ответ на: комментарий от RazrFalcon

Так что, discard не нужен?

Дело не в этом. Дело в том, что хотя при включенном discard в асимптотике ты имеешь все свободные ячейки trim'нутыми, там слишком много «если». Раз чистятся только освобождённые блоки, для очистки блок нужно освободить.

i-rinat ★★★★★ ()

меня уже эти ssd задолбали - то пропадают, выну полежат - после чего появляются снова, поначалу покупал радуясь визуальному приросту производительности - больше не буду, уж лучше hdd - некоторым по 15 лет и ничего работают, правда говорят сейчас научились делать так что бы они ломались в течении года... так что еду пока на старых запасах

amd_amd ★★★ ()
Ответ на: комментарий от RazrFalcon

В принципе сейчас они все ппочти одинаковы Бодьшое количество записей - запросов быстро убъёт любой SSD Postgresql сожрал за полтора года. Теперь работаю только в связке с HDD

qqsi ()
Ответ на: комментарий от qqsi

Бодьшое количество записей - запросов быстро убъёт любой SSD Postgresql сожрал за полтора года.

Какой именно ssd был сожран?

greenman ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.