LINUX.ORG.RU

SSD труп?

 apacer, ,


0

1

Купил новый SSD в начале лета. Почти им не пользовался. Ситуация:

Model Family:     Apacer AS340/350 SSDs
Device Model:     Apacer AS340 240GB
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0032   100   100   050    Old_age   Always       -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   050    Old_age   Always       -       2
  9 Power_On_Hours          0x0032   100   100   050    Old_age   Always       -       123
 12 Power_Cycle_Count       0x0032   100   100   050    Old_age   Always       -       72
160 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       0
161 Unknown_Attribute       0x0033   100   100   050    Pre-fail  Always       -       91
163 Max_Erase_Count         0x0032   100   100   050    Old_age   Always       -       15
164 Average_Erase_Count     0x0032   100   100   050    Old_age   Always       -       2263
165 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       11
166 Later_Bad_Block_Count   0x0032   100   100   050    Old_age   Always       -       1
167 SSD_Protect_Mode        0x0032   100   100   050    Old_age   Always       -       6
168 SATA_PHY_Error_Count    0x0032   100   100   050    Old_age   Always       -       5050
169 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       100
175 Bad_Cluster_Table_Count 0x0032   100   100   050    Old_age   Always       -       0
176 Erase_Fail_Count_Chip   0x0032   100   100   050    Old_age   Always       -       0
177 Wear_Leveling_Count     0x0032   100   100   050    Old_age   Always       -       0
178 Used_Rsvd_Blk_Cnt_Chip  0x0032   100   100   050    Old_age   Always       -       2
181 Program_Fail_Cnt_Total  0x0032   100   100   050    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   100   100   050    Old_age   Always       -       0
192 Unexpect_Power_Loss_Ct  0x0032   100   100   050    Old_age   Always       -       28
194 Temperature_Celsius     0x0022   100   100   050    Old_age   Always       -       40
195 Hardware_ECC_Recovered  0x0032   100   100   050    Old_age   Always       -       988957
196 Reallocated_Event_Count 0x0032   100   100   050    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   050    Old_age   Always       -       2
198 Offline_Uncorrectable   0x0032   100   100   050    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x0032   100   100   050    Old_age   Always       -       0
232 Available_Reservd_Space 0x0032   100   100   050    Old_age   Always       -       91
241 Total_LBAs_Written      0x0030   100   100   050    Old_age   Offline      -       10877
242 Total_LBAs_Read         0x0030   100   100   050    Old_age   Offline      -       39960
245 Unknown_Attribute       0x0032   100   100   050    Old_age   Always       -       19897

Значения Reallocated_Sector_Ct и Current_Pending_Sector пару часов назад показывали 1, сейчас уже 2.

★★★

создай btrfs на нем и файлы покопируй на него, а потом проверь файловую систему на ошибки чексум. это самый верный способ определить неисправность диска

rtxtxtrx ★★★
()

Смотрю по SMART вашего Apacer AS340 240GB, вот ключевые моменты:

  • 5 Reallocated_Sector_Ct = 2 Уже есть переназначенные сектора. Для SSD это тревожный сигнал, хотя пока немного.

  • 166 Later_Bad_Block_Count = 1 Появился один сбойный блок уже в процессе эксплуатации.

  • 197 Current_Pending_Sector = 2 Есть два «подозрительных» сектора, которые пока не удалось переназначить. Это плохой знак: может превратиться в реальные ошибки.

  • 178 Used_Rsvd_Blk_Cnt_Chip = 2 Использованы резервные блоки памяти (пока запас есть, но это значит, что износ уже начался).

  • 164 Average_Erase_Count = 2263 Среднее число циклов стирания у блоков — довольно высокое, особенно при том, что наработано всего 123 часа. Либо диск активно использовали, либо контроллер «врёт».

  • 168 SATA_PHY_Error_Count = 5050 Очень много ошибок физического уровня SATA — это может быть либо из-за кабеля/порта, либо проблем с самим SSD.

  • 232 Available_Reservd_Space = 91 Запас по резервным блокам ещё есть (~91%), но он уменьшается.

📌 Итог: Диск живой, но уже есть признаки деградации памяти и контроллера. Для относительно молодого SSD (123 часа работы) наличие переназначенных секторов и pending-секторов выглядит подозрительно.

👉 Рекомендации:

  1. Сделать резервные копии важных данных — лучше не доверять этому SSD.
  2. Проверить SATA-кабель и порт (снизит ли это счётчик PHY ошибок).
  3. Использовать его только под второстепенные задачи, не как системный/рабочий диск.
  4. Мониторить SMART: если Reallocated или Pending будут расти — диск под замену.

Хотите, я прикину, сколько реально он ещё может «прожить», если тенденция сохранится?

MoldAndLimeHoney ★★
()
Ответ на: комментарий от einhander

понимаю. больная тема для ext4-дрочеров и прочих фриков, ненавидящих опр технологии, но как еще определить целостность данных?

rtxtxtrx ★★★
()
Ответ на: комментарий от MoldAndLimeHoney

сейчас бы мусорным называть бренд, который для сони карты памяти делал. это нормальный бренд как и какой-нибудь нетак, который самсунги и адата штамповал с их наклейками

rtxtxtrx ★★★
()
Ответ на: комментарий от MoldAndLimeHoney

Там и бэкапить особо нечего: на накопителе стоит склонированный с другого компа Арч, а данные в хомяке зеркалируются в syncthing.

бренд

Вот это самая главная ошибка, нехрен было покупать его чисто потому что он был в наличии в ближайшем магазине, а Crucial там не было.

А зачем тогда тему создал?

Умных людей послушать.

wandrien ★★★
() автор топика
Ответ на: комментарий от rtxtxtrx

Хз, мусорный он или нет. Не имел дела прежде. Я тогда купил сразу парочку: один себе в качестве «флешки», второй для знакомой, т.к. она просила систему с hdd перенести. Надо будет у ней тоже смарт глянуть теперь.

Хотел взять Crucial BX, но он был на 750 рублей дороже и ждать под заказ. Поэтому взял этот.

wandrien ★★★
() автор топика
Последнее исправление: wandrien (всего исправлений: 1)
Ответ на: комментарий от wandrien

ну там есть в днс процент брака. он как надежность подписан. у самсунгов 0.5% ссд отлетают, у других - 1-2%. тебе просто не повезло. создавай btrfs, копируй 100-гиговую папку м проверяй на ошибки, если есть, то можно на замену сдавать

rtxtxtrx ★★★
()

А SATA_PHY_Error_Count такой с самого начала был?

ИМХО, сразу после покупки, пока есть гарантия, нужно записать SMART, потом весь диск забить данными, потом прочить/сравнить и данные и SMART. Потом secure erase. У вас, судя по Total_LBAs_Written далеко не все ячейки флеш-памяти были задействованы, может заводской брак. И Crucial мог оказаться тоже с завода бракованым.

И btrfs для теста не нужна, там как раз не гарантируется, что все блоки будут записаны. Можно велосипед из файла со случайным содержимым, который dd туда-обратно и cmp. Можно f3probe из f3 tools.

mky ★★★★★
()

Не разглядывайте SMART, и с SSD будет всё в порядке. В вашем примере SMART не является угрожающим Но важные дркументы надо копировать ппо запас независимо от SMART.

Partisan ★★★★★
()

в начале лета.

Стало быть, гарантия ещё действует

NyXzOr ★★★★★
()
Ответ на: комментарий от wandrien

Crucial BX

Можешь не сожалеть, это тоже хрень, ничем не лучше сабжа

anonymous
()
Ответ на: комментарий от mky

так запиши все блоки. кто тебе мешает. криворукие обезьяны, наверное, хеши будут вручную вычислять и сравнивать - лишь бы не btrfs, а то они очень боятся всех этих новых технологий из 2015

rtxtxtrx ★★★
()
Ответ на: комментарий от Partisan

да там и вероятнее, что смарт показывает чушь. там в самой проге захардкожено что какое поле значит в зависимости от модели, что доверия ему не добавляет. точно состояние диска можно узнать только из под винды, скачав утилиту от апасера. но все равно нужно доподлинно установить, что диск не херит данные, а для этого нужно убедиться, что данные записываются байт в байт. спорить с плоскоземельцами бесполезно. самый простой способ я описал.

rtxtxtrx ★★★
()
Последнее исправление: rtxtxtrx (всего исправлений: 1)
Ответ на: комментарий от rtxtxtrx

Нет никаких btrfs, такой файловой системы в продакшене не существует. значит не существует вовсе. Зачем вы занимаетесь вредительством и советуете всякий трэш?

Frohike
()

У меня кстати такой же только объем больше

=== START OF INFORMATION SECTION ===
Model Family:     Apacer AS340/350 SSDs
Device Model:     Apacer AS340 480GB

Это Reallocated_Sector_Ct = 0.

Такое есть:

166 Later_Bad_Block_Count   0x0033   100   100   010    Pre-fail  Always       -       3

Запусти тест:

sudo smartctl --test=long /dev/sda

А потом посмотри результаты. Мой диск помирать не собирается. Правда, я им почти и не пользуюсь (3 терабайта записано). Ему около 3-х лет. Просто зашифровал его и храню экстремизм всякий

rtxtxtrx ★★★
()
Последнее исправление: rtxtxtrx (всего исправлений: 1)
Ответ на: комментарий от Dimez

Самое прямое

По вашей ссылке какие-то устройства без упоминания btrfs.

Не люблю и не использую Synology.

Это очень правильная позиция.

В мире COW FS есть только ZFS, всё остальное поделки безграмотных чайников. BTRFS - образец дикого проекта от людей не знающих Computer Science.

Frohike
()
Ответ на: комментарий от Frohike

мне абсолютизм не нравится, да btrfs кривой и медленный, но в продакшене он присутствует (фейсбук да и в proxmox по умолчанеию, вручную меняю), может не до конца тестируют, у меня вот по тестам зщамена btrfs на ext4 даёт не хилый выигрышь 10-20% (на фрониксе более тонкие тесты, я тупо производительность всей системы), бекап дешевле-надёжнее снепшотов.

s-warus ★★★★
()
Ответ на: комментарий от s-warus

да btrfs кривой и медленный

Что мешает использовать прямой и быстрый ZFS?

Frohike
()
Ответ на: комментарий от Frohike

По вашей ссылке какие-то устройства без упоминания btrfs.

В них во всех btrfs.

Dimez ★★★★★
()
Ответ на: комментарий от rtxtxtrx

так запиши все блоки

Блоки, зарезервированные под метаданные ФС тоже запишутся все? И блоки между разделами SSD?

хеши будут вручную вычислять

Зачем хеши вычислять? В случае dd не удаляем записываемый файл. Если исходные данные есть, просто сравниваем, для сравнения двух файлов не нужно вычислять хеш.

этих новых технологий из 2015

Дак, новизна технологий не по возрасту, а по свежести ошибок и жаланию на них отвечать. https://bbs.archlinux.org/viewtopic.php?id=279617  — scrub без ошибок, но ″corrupt 1″ и никаких комментариев, так и должно быть или нет.

криворукие обезьяны

То есть те, кто могут писать скрипты — криворукие? Зато фанаты новых технологий не ищут лёгких путей, им ни времени, ни телодвижений не жалко. Вместо запуска f3probe, им проще создать раздел на диске, отформатировать, копировать и ждать пока запишется, с учётом что у btrfs усиление записи, потом читать записанные файлы и смотреть dmesg или scrub запускать.

mky ★★★★★
()
Ответ на: комментарий от mky

это все выглядит как оправдания. очень неадекватная реакция на одну из нескольких систем с контролем целостности данных, которая есть в любом стандартном репозитории

rtxtxtrx ★★★
()
Последнее исправление: rtxtxtrx (всего исправлений: 1)
Ответ на: комментарий от rtxtxtrx

там в самой проге захардкожено что какое поле значит в зависимости от модели, что доверия ему не добавляет

Наверное потому, что для разных накопителей одни и те же аттрибуты могут иметь разное назначение, нет?

u5er ★★★
()
Ответ на: комментарий от rtxtxtrx

То есть по делу сказать нечего? «corrupt 1» откомментировать не можете. Начали разводить сопли: «оправдания», «неадекватная»...

систем с контролем целостности данных

Надо не данные, надо весь SSD проверять.

которая есть в любом стандартном репозитории

Не знаю, правильно ли я расшифровал ваш пост, очень заувалировано пишете, но так, для информации: https://docs.redhat.com/en/documentation/red_hat_enterprise_linux/8/html/cons... и в девятый не вернули.

Мой диск помирать не собирается... зашифровал ... храню

Вы в курсе, что приличный процент SSD умирает с прекрасными показателями в SMART'е? Просто раз и слетела прошивка. И потом прекрасно прошиваются соответствющей тулзой и дальше работают с чистым SMART, только данных уже нет.

mky ★★★★★
()

Если я правильно понимаю, единственное,что может угробить ssd - это перегрев. Было?

geometer
()
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
...
  9 Power_On_Hours          0x0032   100   100   050    Old_age   Always       -       123
 12 Power_Cycle_Count       0x0032   100   100   050    Old_age   Always       -       72
...

Компьютер перегружается каждые 1 час и 42 минуты?

VIT
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.