LINUX.ORG.RU

Винчестер и время

 , , ,


0

7

Оказывается, если купить винчестер, а потом забыть про него на три года, то он работает очень не очень. 18Тб WD выдаёт мне кучу ошибок чтения. Такие дела.

Перемещено maxcom из talks

★★★★★

Последнее исправление: ptah_alexs (всего исправлений: 1)

В dmesg такое:

[ 1507.619812] ata4.00: exception Emask 0x0 SAct 0x72 SErr 0x40000 action 0x0
[ 1507.621225] ata4.00: irq_stat 0x40000008     
[ 1507.622539] ata4: SError: { CommWake }                                                            
[ 1507.623871] ata4.00: failed command: READ FPDMA QUEUED                  
[ 1507.625174] ata4.00: cmd 60/00:20:00:18:04/04:00:00:00:00/40 tag 4 ncq dma 524288 in       
                        res 43/40:50:b0:1a:04/00:01:00:00:00/40 Emask 0x408 (media error) <F>
[ 1507.627804] ata4.00: status: { DRDY SENSE ERR }
[ 1507.629105] ata4.00: error: { UNC }                                                               
[ 1507.712657] ata4.00: configured for UDMA/133  
[ 1507.715144] sd 3:0:0:0: [sda] tag#4 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=20s
[ 1507.715150] sd 3:0:0:0: [sda] tag#4 Sense Key : Medium Error [current] 
[ 1507.715155] sd 3:0:0:0: [sda] tag#4 Add. Sense: Unrecovered read error
[ 1507.715160] sd 3:0:0:0: [sda] tag#4 CDB: Read(16) 88 00 00 00 00 00 00 04 18 00 00 00 04 00 00 00
[ 1507.715163] critical medium error, dev sda, sector 268976 op 0x0:(READ) flags 0x0 phys_seg 8 prio class 3
[ 1507.716573] ata4: EH complete
[ 1510.600369] scrub_stripe_report_errors: 734 callbacks suppressed
[ 1510.600372] BTRFS error (device sda1): fixed up error at logical 124321792 on dev /dev/sda1 physical 132710400
[ 1510.601770] BTRFS error (device sda1): fixed up error at logical 124649472 on dev /dev/sda1 physical 133038080
[ 1510.601770] BTRFS error (device sda1): fixed up error at logical 124715008 on dev /dev/sda1 physical 133103616
[ 1510.601772] BTRFS error (device sda1): fixed up error at logical 124321792 on dev /dev/sda1 physical 132710400
[ 1510.601772] BTRFS error (device sda1): fixed up error at logical 124452864 on dev /dev/sda1 physical 132841472
[ 1510.601775] BTRFS error (device sda1): fixed up error at logical 124321792 on dev /dev/sda1 physical 132710400
[ 1510.601778] BTRFS error (device sda1): fixed up error at logical 124715008 on dev /dev/sda1 physical 133103616
[ 1510.601780] BTRFS error (device sda1): fixed up error at logical 124452864 on dev /dev/sda1 physical 132841472
[ 1510.601788] BTRFS error (device sda1): fixed up error at logical 124715008 on dev /dev/sda1 physical 133103616
[ 1510.601793] BTRFS error (device sda1): fixed up error at logical 124452864 on dev /dev/sda1 physical 132841472
ptah_alexs ★★★★★
() автор топика

Примерно 2% жёстких дисков умирают в первые дни эксплуатации. Никогда не убирай на полку 1 нераспакованный диск. Всегда может оказаться, что именно твой - мертворожденный.

Khnazile ★★★★★
()
Ответ на: комментарий от gadel

молекула мелкая, вон водород H₂ сквозь металл проходит, сам металл (сталь) хрупкой становится, да и взрывается. Научишься водород безопасно перевозить-хранить, озолотишься и Маск с теслой разорится ибо получить его просто (электролиз), и обратно в электроэнергию превратить каталитическим способом без проблемно (такой опасный взрывающийся аккамулятор).

s-warus ★★★★
()
Ответ на: комментарий от s-warus

Водород в баллонах под 200 атм спокойно стоит годами, и баллон от хрупкости не рассыпается, и давление не уходит. Толстая металлическая стенка — это совсем не оболочка воздушного шарика.

А из берданов гелий, скорее всего, уходит через уплотнения, а не через металл. И, явно, если сделать подороже, то срок службы лет 10 вполне можно получить, но производителю не надо.

У топливных элементов тоже проблем хватает, и «такой опасный взрывающийся аккамулятор» хорош только как стационарный, как аналоги ГАЭС (гидроаккумулирующая электростанция).

mky ★★★★★
()
Ответ на: комментарий от ptah_alexs

а сразу после покупки он проверялся?
смарт есть после покупки?
а то может он сразу того был - неживым.
его могли, например, приложить на складе или при перевозке.

mumpster ★★★★★
()
Ответ на: комментарий от mumpster

После покупки включал, чтобы проверить, что определяется в системе. Смарт не смотрел. А потом отложил и забыл. Да смарт и сейчас нормально выглядит, кроме Raw_Read_Error_Rate:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   085   085   001    Pre-fail  Always       -       70320311
  2 Throughput_Performance  0x0005   100   100   054    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   084   084   001    Pre-fail  Always       -       302 (Average 345)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       12
  5 Reallocated_Sector_Ct   0x0033   100   100   001    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   001    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   020    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       10
 10 Spin_Retry_Count        0x0013   100   100   001    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       12
 22 Helium_Level            0x0023   100   100   025    Pre-fail  Always       -       100
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       12
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       12
194 Temperature_Celsius     0x0002   060   060   000    Old_age   Always       -       34 (Min/Max 25/45)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       136
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   100   100   000    Old_age   Always       -       0
ptah_alexs ★★★★★
() автор топика
Ответ на: комментарий от mky

трубопроводы через несколько лет становятся хрупкими от вибрации рядом стоящей турбины разрушаются-становятся не герметичными, водород на электростанциях в генераторах используют его аэросопротивление низкое почти прямо тут же его водород получают. Химички с банками ходят на хлопок проверяют, не смотря на предосторожности раза два в год хлопает утечка.

Топливные элементы это тот же на водороженый сплав который для освобождения водорода ещё надо нагреть.

s-warus ★★★★
()
Последнее исправление: s-warus (всего исправлений: 1)
Ответ на: комментарий от ptah_alexs

для WD обычно нехарактерно высокий RRER в нормальном состоянии, это не сигейты, вот типичный WD:

1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0

разные флаги - отличие в O и K (0x2f==POSR.K, 0xb==PSR), несущественно
а 12 включений - это когда проверять начал?

и судя про CurPendSec/197 == 136 - он - почти труп.

попробуй для начала запустить самопроверку, иногда спасает:

smartctl -t long DEVICE , напишет сколько ждать надо будет, вангую что там сутки ждать надо будет для 18тб

по -a будет писать сколько ещё осталось % проверки, а по завершении напишет итоги:

Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
n 1 Extended offline Completed without error 00% 4852 -
n 2 Short offline Completed without error 00% 4846 -

mumpster ★★★★★
()
Последнее исправление: mumpster (всего исправлений: 1)
Ответ на: комментарий от mumpster

и судя про CurPendSec/197 == 136 - он - почти труп.

Ещё один. Автор в начале темы об этом рассказал.

Ошибка чтения сектора автоматически превращает его в pending, незачем на это число в смарте как на открытие смотреть.

firkax ★★★★★
()
Ответ на: комментарий от ptah_alexs

Судя по

SMART Extended Self-test Log Version: 1 (1 sectors)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%         7         269480
# 2  Extended offline    Completed: read failure       90%         2         7456

он у тебя на старте был уже с проблемами.

Погоди, ты тот смарт выложил то?

9 Power_On_Hours          -O--C-   100   100   000    -    10

Этому диску 10 часов пробега

Dimez ★★★★★
()
Последнее исправление: Dimez (всего исправлений: 1)
Ответ на: комментарий от Dimez

Да, я ж говорю что после покупки только один раз включал, а теперь решил его поставить вместо старого винта, но тут меня подстерёг полярный лис. А так он три года пролежал в ящике.

ptah_alexs ★★★★★
() автор топика
Последнее исправление: ptah_alexs (всего исправлений: 1)
Ответ на: комментарий от ptah_alexs

Да, я ж говорю что после покупки только один раз включал, а теперь решил его поставить вместо старого винта

А, теперь понятно (а то раньше я подумал, что он 3 года стоит и работает, забытый)

Это 2 твоих теста уже, да? Которые на после 10% прохода завалились?

Dimez ★★★★★
()
Последнее исправление: Dimez (всего исправлений: 1)
Ответ на: комментарий от s-warus

При чём тут трубопроводы с вибрацией? Исходно было:

сквозь металл проходит

Если, в случае НЖМД, считать кол-во гелия, пошедшего сквозь металлическую стенку, то ничтожное кол-во получится. Гелий, как и водород, стоит себе в баллонах под огромным давлением и ничего.

его аэросопротивление низкое

Его там для охлаждения генератора используют, у него теплопроводность высокая, иначе бы просто разряжение создавали, если бы тепло не надо было отводить. И там такой системе куча трубопроводов, теплообменников, насосов и пр. Вибрации, тепловые расширения прекрасно разрушают всё, не только металл трубопроводов, но и стыки...

Вобще я ваш полёт мысли не понял:

Научишься водород безопасно перевозить-хранить, озолотишься

в баллонах под 200 атм спокойно

трубопроводы через несколько лет становятся хрупкими от вибрации рядом стоящей турбины

В баллонах водород хранят, транспортируют, да ещё и кантуют нещадно, пока от машины до сварочной плиты. Проблема водорода, в том, что его смесь с воздухом взрывоопасна в широчайшем дипазоне. И там, где есть газообразный водород, любая его утечка легко приводит к взрыву.

через несколько лет становятся хрупкими

раза два в год хлопает утечка.

То есть, допустим, через 3 года трубопровод хрупкий, два раза в год утечка, но его не меняют на новый, а продолжают работат?

mky ★★★★★
()
Ответ на: комментарий от rtxtxtrx

Чего нет, того нет. Но там и нечего корректировать ещё, потому только начал на винт данные заливать.

ptah_alexs ★★★★★
() автор топика
Последнее исправление: ptah_alexs (всего исправлений: 1)

Да у тебя, наверное, просто размагнитилась поверхность и блоки трёхлетней давности не читаются. Конечно у тебя слефтест смарта будет находить первый же pending и останавливаться. Форматни его. badblocks -t 0 -w -b4096 /dev/disk/by-id/ata-WD....

legolegs ★★★★★
()
Ответ на: комментарий от legolegs

Попробую.

Конечно у тебя слефтест смарта будет находить первый же pending и останавливаться

Т.е. селфтест не продолжается после найденной ошибки и ждать заявленные 34 часа до конца нет смысла?

ptah_alexs ★★★★★
() автор топика
Ответ на: комментарий от ptah_alexs

Именно так. Селфтест всё равно не может ничего СДЕЛАТЬ с pending sector, поскольку в них всё ещё лежат пользовательские данные, которые пользователь может надеяться восстановить. Сделать что-то можно после того, как хост запросит запись в больной сектор, но селфтест ничего никогда не пишет, так что продолжать не имеет смысла. Ну, так думали разработчики smart.

legolegs ★★★★★
()
Последнее исправление: legolegs (всего исправлений: 1)
Ответ на: комментарий от legolegs

badblocks: Значение слишком велико для такого типа данных invalid end block (4394582016): must be 32-bit value

Ох ты ж, ё моё. Разбил на пару разделов, чтобы обойти это ограничение.

ptah_alexs ★★★★★
() автор топика

18Тб WD выдаёт мне кучу ошибок чтения

Поэтому и не надо покупать черепичные диски. Был бы какой 1Tb WD AV25 - и через 10 лет всё прекрасно прочиталось бы.

Вообще, конечно, забавно как корпорации массово заставили хомячков покупать откровенное говнище типа черепичных дисков и флешек под видом SSD у которых вообще гарантированно ограниченный срок службы. При этом для тех же HDD они старательно скрывают используемый метод записи и даже модели которые ранее были строго CMR без каких-либо предупреждений начинают выпускать в черепичном виде.

Stanson ★★★★★
()
Ответ на: комментарий от Stanson

Поэтому и не надо покупать черепичные диски.

Но это CMR.

Был бы какой 1Tb WD AV25

Как тебе вообще в голову пришло сравнивать 18тб и 1тб, который к тому же снят с продаж?

у которых вообще гарантированно ограниченный срок службы

У всех устройств ограниченный срок службы.

При этом для тех же HDD они старательно скрывают используемый метод записи и даже модели которые ранее были строго CMR без каких-либо предупреждений начинают выпускать в черепичном виде.

На этом уже обожглись и больше так не делают. (Потребительские модели в счет не идут.)

MagicMirror ★★★
()
Ответ на: комментарий от MagicMirror

Но это CMR.

Нет, это не CMR. 18Тб CMR просто физически не упихать в 3.5" Тому кто тебе сказал что это CMR надо бить в рожу без раздумий.

Как тебе вообще в голову пришло сравнивать 18тб и 1тб,

Именно в объёме дело. Хомячок дрочащий на терабайты - целевая аудитория корпорастов. Именно в покупке диска с таким объёмом и заключалась ошибка.

который к тому же снят с продаж?

Производство прекращено но в продаже есть до сих пор. Причём именно то, что производство прекращено и гарантирует что купленный сегодня AV25 будет CMR а не черепичной подделкой.

На этом уже обожглись и больше так не делают.

И продают 18Тб диски как CMR. Ну-ну.

Потребительские модели в счет не идут

18Тб - 100% потребительская черепичная модель. Что бы ни было на ней написано, и какую бы лапшу на уши не вешал продаван.

Stanson ★★★★★
()
Последнее исправление: Stanson (всего исправлений: 1)
Ответ на: комментарий от Stanson

Нет, это не CMR. 18Тб CMR просто физически не упихать в 3.5"

С разморозкой что-ли.

Именно в объёме дело. Хомячок дрочащий на терабайты - целевая аудитория корпорастов. Именно в покупке диска с таким объёмом и заключалась ошибка.

Тебя по голове не били? Место в корзине не резиновое, знаешь ли, чтобы его смешными 1тб забивать.

И продают 18Тб диски как CMR. Ну-ну.
18Тб - 100% потребительская черепичная модель. Что бы ни было на ней написано, и какую бы лапшу на уши не вешал продаван.

Один ты в штанах, конечно.

MagicMirror ★★★
()
Ответ на: комментарий от MagicMirror

С разморозкой что-ли.

Именно что. Возможности CMR по плотности записи были исчерпаны где-то в 2010 году. 2.5" максимум 2Тб, 3.5" максимум 10Тб. С тех пор ничего не поменялось. Увеличить объём диска за счёт добавления блинов уже невозможно в силу форм-фактора дисков. Поэтому и пришлось придумывать черепичную запись.

Stanson ★★★★★
()
Ответ на: комментарий от Stanson

Возможности CMR по плотности записи были исчерпаны где-то в 2010 году. 2.5" максимум 2Тб, 3.5" максимум 10Тб

Все врут один ты истину знаешь

Увеличить объём диска за счёт добавления блинов уже невозможно в силу форм-фактора дисков.

Зачем там гелий по твоему?

MagicMirror ★★★
()
Ответ на: комментарий от MagicMirror

PDF’ка всё стерпит.

Интересно, кем надо быть в 2025 году чтобы верить в то, что написано в рекламном буклете корпорации?

Зачем там гелий по твоему?

Примерно затем же, зачем шины азотом накачивают. :) А если серёзно, то гелий там для формальной экономии 1% электричества потребляемого двигателем. Чтобы продемонстрировать поклонение зелёной повесточке.

Гелий вообще никак не поможет увеличить плотность конвенциональной записи. А вот вязкость у него меньше, да. Соответственно формально потери двигателя на преодоление вязкости газа вокруг блинов будут меньше. И, заодно ещё одна принципиально никак не проверяемая пользователем отмазка будет у производителя в случае фейла - «а это ты с диском плохо обращался, весь гелий вышел, вот диск и посыпался, никакой гарантийной замены, пшёл вон».

Stanson ★★★★★
()
Ответ на: комментарий от Stanson

Нет, это не CMR. 18Тб CMR просто физически не упихать в 3.5" Тому кто тебе сказал что это CMR надо бить в рожу без раздумий.

Стукни себе, если такой агрессивный. Потом промотай до спеков и узри там заветную аббревиатуру CMR: https://www.westerndigital.com/products/internal-drives/data-center-drives/ultrastar-dc-hc550-hdd?sku=0F38458

Dimez ★★★★★
()