LINUX.ORG.RU

Проблемы с HDD

 , ,


0

1

Походу начал сыпаться HDD. После перезагрузки на сплеше биоса висит около минуты, за тем грузиться система (благо на другом диске находится), но не может смонтировать сбойный диск.

Вот что говорит S.M.A.R.T:

smartctl -a /dev/sdb 
smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.8.6-gentoo-dielectric-04] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Samsung SpinPoint M8 (AF)
Device Model:     ST1000LM024 HN-M101MBB
Serial Number:    S2U5JACCB34642
LU WWN Device Id: 5 0004cf 2090a04c8
Firmware Version: 2AR10001
User Capacity:    1 000 204 886 016 bytes [1,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      2.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 6
SATA Version is:  SATA 3.0, 3.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Fri Nov  4 21:51:05 2016 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      ( 121) The previous self-test completed having
                                        the read element of the test failed.
Total time to complete Offline 
data collection:                (13080) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 218) minutes.
SCT capabilities:              (0x003f) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   051    Pre-fail  Always       -       339
  2 Throughput_Performance  0x0026   252   252   000    Old_age   Always       -       0
  3 Spin_Up_Time            0x0023   089   076   025    Pre-fail  Always       -       3455
  4 Start_Stop_Count        0x0032   087   087   000    Old_age   Always       -       13972
  5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   252   252   051    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       14781
 10 Spin_Retry_Count        0x0032   252   252   051    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       50
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3453
191 G-Sense_Error_Rate      0x0022   100   100   000    Old_age   Always       -       156
192 Power-Off_Retract_Count 0x0022   252   252   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0002   041   025   000    Old_age   Always       -       59 (Min/Max 20/75)
195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0030   252   252   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0036   100   100   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x002a   001   001   000    Old_age   Always       -       70682
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       50
225 Load_Cycle_Count        0x0032   055   055   000    Old_age   Always       -       463242

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%     14781         776562688
# 2  Extended offline    Aborted by host               90%     14781         -
# 3  Short offline       Completed: read failure       90%     14781         776562688
# 4  Short offline       Completed: read failure       90%     14780         776562688
# 5  Short offline       Completed: read failure       90%     14780         776562688
# 6  Short offline       Completed: read failure       90%     14780         776562688
# 7  Short offline       Completed: read failure       90%     14780         776562688

SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Completed_read_failure [90% left] (0-65535)
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

А вот что в dmesg:

[  100.865126] ata2: hard resetting link
[  101.172684] ata2: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[  101.185620] ata2.00: configured for UDMA/100
[  101.185628] ata2.00: device reported invalid CHS sector 0
[  101.185630] ata2.00: device reported invalid CHS sector 0
[  101.185643] ata2: EH complete
[  103.084917] ata2.00: exception Emask 0x0 SAct 0x1c000 SErr 0x0 action 0x0
[  103.084920] ata2.00: irq_stat 0x40000008
[  103.084924] ata2.00: failed command: READ FPDMA QUEUED
[  103.084931] ata2.00: cmd 60/08:70:00:68:49/00:00:2e:00:00/40 tag 14 ncq dma 4096 in
                        res 41/40:00:00:68:49/00:00:2e:00:00/40 Emask 0x409 (media error) <F>                                                                                                
[  103.084933] ata2.00: status: { DRDY ERR }
[  103.084934] ata2.00: error: { UNC }
[  103.097867] ata2.00: configured for UDMA/100
[  103.097890] sd 1:0:0:0: [sdb] tag#14 UNKNOWN(0x2003) Result: hostbyte=0x00 driverbyte=0x08
[  103.097894] sd 1:0:0:0: [sdb] tag#14 Sense Key : 0x3 [current] 
[  103.097897] sd 1:0:0:0: [sdb] tag#14 ASC=0x11 ASCQ=0x4 
[  103.097901] sd 1:0:0:0: [sdb] tag#14 CDB: opcode=0x28 28 00 2e 49 68 00 00 00 08 00
[  103.097903] blk_update_request: I/O error, dev sdb, sector 776562688
[  103.097907] Buffer I/O error on dev sdb4, logical block 0, async page read

Насколько все плохо, поддается ли это лечению или проще новый HDD купить?

★★★★★

Т.е. данные не ценны?
Я бы сначала их перенес на живой диск, а уже потом подумал про этот.

dk- ()
Ответ на: комментарий от dk-

На данные пофиг. Я все ценное в облако зеркалю, а HDD для быстрого оффлайн доступа.

deterok ★★★★★ ()
Ответ на: комментарий от dk-

Какой-то бред на лоре... Пока не нажал показать всех, тебя не показывало. Думал как ты попал в бан у меня, не помню ничего такого, захожу в твой профиль, а ты не заигнорин. Баг?

deterok ★★★★★ ()
Ответ на: комментарий от dk-

Сообщения приходят, фильтр в комментариях скрывает.

deterok ★★★★★ ()
Ответ на: комментарий от smilessss

Кстати, а это нормально, что на сплеше биоса оно около минуты висит?

deterok ★★★★★ ()
Reallocated_Sector_Ct   0
Current_Pending_Sector  1

Один битый сектор (пока)
И даже адрес его есть

# 1 Short offline Completed: read failure 90% 14781 776562688
[ 103.097903] blk_update_request: I/O error, dev sdb, sector 776562688

Victoria/MHDD пройтись, после чего понаблюдать. Как файлохранилище пусть живет

Kuzz ★★★ ()
Последнее исправление: Kuzz (всего исправлений: 1)
Ответ на: комментарий от Kuzz

Да я уже надумал новый заказать, но этот тоже попробую восстановить, посмотреть что получиться. Какие марки сейчас неплохие для ноутов с линуксами?

deterok ★★★★★ ()

А ты его хорошенько прогреваешь:

194 Temperature_Celsius     0x0002   041   025   000    Old_age   Always       -       59 (Min/Max 20/75)
и встряхиваешь:
191 G-Sense_Error_Rate      0x0022   100   100   000    Old_age   Always       -       156

gag ★★★★★ ()
Ответ на: комментарий от Kuzz

Victoria/MHDD пройтись, после чего понаблюдать. Как файлохранилище пусть живет

Или прямо в линуксе с помощью badblocks из e2fsprogs:

# badblocks -b 4096 -c 2048 -n -s -v /dev/disk/by-id/ata-ST1000LM024...
Перезапишет все блоки с сохранением данных.

gag ★★★★★ ()
Ответ на: комментарий от smilessss

сделай ему низкоуровневое форматирование

Настоящее? Это как с генератором случайных чисел имеется ввиду практически всегда генератор псевдослучайных чисел, так и с низкоуровневым форматированием уже давно имеется ввиду «обнуление» секторов (на пластину всё равно не нули пишутся), а не обновление сервоинформации.

gag ★★★★★ ()
Ответ на: комментарий от gag

Да вот ноутбук пережил как-то уже встречу с пьянью :) Но в целом максимум что ему могло доставить таких хлопот это поездка пару раз в багажнике, ну и в электричке на полке. Так что я не удивлен. А то что он греется, ну это к проектировщику lenovo y580.

deterok ★★★★★ ()
Ответ на: комментарий от deterok

-w - это самое простое, и если данные не нужны, то подходящее. Т.к. у обычных дисков сектора не были размером в 1024 байт (раньше 512, теперь 4096), я использую -b 4096. Чтобы скорость была повыше я подобрал оптимальное для моих условий кол-во тестируемых блоков за раз: -c 2048. А -s -v - это чтобы получше видеть прогресс.

gag ★★★★★ ()
Ответ на: комментарий от deterok

это поездка пару раз в багажнике, ну и в электричке на полке.

В выключенном состоянии они пока ещё не следят за нами^W собой. У этого есть и отрицательный эффект: когда покупаешь новый диск, то невозможно узнать, а не побитый ли он уже.

gag ★★★★★ ()
Ответ на: комментарий от gag

Ну я имел ввиду, что ноут нигде не засветился больше. Т.е. я его во время работы максимум когда мог потрясти - в электрички/метро. Никогда не падал во время работы.

deterok ★★★★★ ()
Ответ на: комментарий от deterok

Ох щи. Ну можно закапывать наверно. На холоде не включал? Холод это меньше 20, хотя зависит от модели.

anonymous ()
Ответ на: комментарий от anonymous

Было дело, около двух лет назад в промерзшем вагоне допиливал проект перед релизом... Там в целом температура была не человеческая около -20.

deterok ★★★★★ ()
Последнее исправление: deterok (всего исправлений: 1)
Ответ на: комментарий от deterok

Это на ~30 градусов меньше допустимой для большинства дисков температуры. Судя по тому что смарт-тесты никогда не выполнялись, можно предположить что он давно деградировал и посыпался? Файлы не терялись при выключении?

anonymous ()
Ответ на: комментарий от anonymous

Тесты не гонял на нем до этого момента. Файлы не терялись, на FS иногда восстанавливать приходилось. Списывал на повреждение после резкого отключения питания.

deterok ★★★★★ ()
Ответ на: комментарий от deterok

Ну вполне возможно, что и накрылся. В переносные устройства сейчас не стоит ставить жёсткие диски, рекомендую ssd от самсунга, 1tb модели сейчас более чем доступны. В принципе скоро всякие распродажи, можно помониторить скидочки. Особенно если живёшь в СШП, бывают очень хорошие предложения.

anonymous ()
Ответ на: комментарий от anonymous

Я предпочту наверное HDD т.к. если он проработает год два в том же режиме я уже буду доволен.

deterok ★★★★★ ()
Ответ на: комментарий от deterok

Можно за 20 почтой, как вариант. Если не сопрут. Ощущения будут исключительно положительные, особенно первые 5-10 лет.

anonymous ()
Ответ на: комментарий от deterok

По-моему это всего лишь 375 мегабайт/сек, ssd сейчас в идеальных условиях значительно больше выдают. Но это не важно, даже так это будет сильно круче hdd.

anonymous ()
Ответ на: комментарий от anonymous

Можно взять и на 500 — всего 160 баксов стоят. Больше и не нужно в лаптопе. Производительность лучше, чем у моделей на 256.

anonymous ()
Ответ на: комментарий от anonymous

Я немного не так написал. Я читал что SATA 3.0 поддерживает 6.0 Gb/s

Но меня смущает вот эта запись в логах SMART:

SATA Version is:  SATA 3.0, 3.0 Gb/s (current: 3.0 Gb/s)

deterok ★★★★★ ()
Ответ на: комментарий от deterok

Зачастую на плате несколько портов, пара 6G остальные 3G. Нужно смотреть спецификацию устройства.

anonymous ()
Ответ на: комментарий от dk-

А чё от аналогов требуется?
Я всегда пользовался smartmontools, badblocks и testdisk. Что умеет эта Victoria, чего не умеют вышеперечисленные?

gasinvein ★★★ ()
Последнее исправление: gasinvein (всего исправлений: 1)
Ответ на: комментарий от gasinvein

Показывать красивые разноцветные картинки, это же очевидно. Ну и ещё там вроде что-то было про измерение времени доступа к разным частям диска, но это сомнительная фича, как по мне. Это же не DVD.

anonymous ()
Ответ на: комментарий от anonymous

Собрал такой лог.

journalctl -xb --no-pager | grep -i 'link up'
ноя 04 23:08:50 localhost kernel: ata1: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
ноя 04 23:08:50 localhost kernel: ata2: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
ноя 04 23:08:50 localhost kernel: ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
 

По логам ata1 - недавно купленный ssd.
ata3 - DVD-rom
ata2 - сдохший диск

Непонятно что значат здесь Gbps. То ли это скорости портов, то ли железок.

В логах ядра видно еще такую запись из которой можно предположить, что на мат плате 6 портов sata с 6 Gbps:

ahci 0000:00:1f.2: AHCI 0001.0300 32 slots 6 ports 6 Gbps 0x7 impl SATA mode
flags: 64bit ncq stag pm led clo pio slum part ems apst

deterok ★★★★★ ()
Ответ на: комментарий от anonymous

А вообще на какого производителя лучше внимание обратить?

Я как-то читал на хабре статью про то, что Seagate ненадежные.

Но еще больше всего меня путает то, что диск у меня содержит в название сразу двух производителей... (Seagate Samsung)

deterok ★★★★★ ()
Ответ на: комментарий от deterok

Имхо в лаптоп что-то вроде такого https://market.yandex.ru/product--hgst-hts721010a9e630/10861729

Но опять же, трясти нельзя, вибрации нельзя, лишний шум... С ssd можно переживать только за матрицу (у неё тоже есть температурный режим работы и сильные вибрации не любит). Не говоря уж о скорости.

anonymous ()
Ответ на: комментарий от deterok

А со сматром что? Сильно плохо?

Да.

Deleted ()
Ответ на: комментарий от gag

встряхиваешь

У спинпойнтов ооооочень чувствительный датчик.

Deleted ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.