LINUX.ORG.RU

[load]Ошибки с диском при загрузке системы


0

1

Где искать ошибку?

До этого стояла бубунта. Снес ее, оставил home и поставил debian testing. Одна ошибка на системном диске (mount point «/») другая на «/home».

[    7.635426] EXT4-fs (sda5): re-mounted. Opts: (null)
[    7.716185] EXT4-fs (sda5): re-mounted. Opts: errors=remount-ro
[    7.784051] loop: module loaded
[    9.993307] ata6.00: exception Emask 0x0 SAct 0x3 SErr 0x0 action 0x0
[    9.993360] ata6.00: irq_stat 0x40000008
[    9.993418] ata6.00: failed command: READ FPDMA QUEUED
[    9.993479] ata6.00: cmd 60/f8:00:f8:18:80/00:00:02:00:00/40 tag 0 ncq 126976 in
[    9.993480]          res 41/40:00:4f:19:80/00:00:02:00:00/40 Emask 0x409 (media error) <F>
[    9.993618] ata6.00: status: { DRDY ERR }
[    9.993674] ata6.00: error: { UNC }
[   10.005234] ata6.00: configured for UDMA/133
[   10.005244] ata6: EH complete
........
[   15.593873] sd 5:0:0:0: [sda] Unhandled sense code
[   15.593874] sd 5:0:0:0: [sda]  Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[   15.593877] sd 5:0:0:0: [sda]  Sense Key : Medium Error [current] [descriptor]
[   15.593880] Descriptor sense data with sense descriptors (in hex):
[   15.593881]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
[   15.593886]         02 80 19 4f
[   15.593888] sd 5:0:0:0: [sda]  Add. Sense: Unrecovered read error - auto reallocate failed
[   15.593891] sd 5:0:0:0: [sda] CDB: Read(10): 28 00 02 80 18 f8 00 00 f8 00
[   15.593896] end_request: I/O error, dev sda, sector 41949519
[   15.593957] Buffer I/O error on device sda6, logical block 297
[   15.594018] Buffer I/O error on device sda6, logical block 298
[   15.594080] Buffer I/O error on device sda6, logical block 299

Весь лог не вижу смысла кидать..а то простыня получится... хэлп)

система грузится, просто надо нажать ctrl+d. но хочеться разобраться)



Последнее исправление: mityash (всего исправлений: 3)

Жёсткий диск сыпется.
1) Срочно бекапьтесь
2) Покажите вывод smartcrl -a /dev/sda
3) Загрузитесь с http://sysresccd.org/ и прогоните MHDD в режиме REMAP по жёсткому диску; убедитесь в том, что все битые сектора отремаплены
4) Прогоните e2fsck -c по разделам с бед-блоками
5) Готовьтесь к замене жёсткого диска

AITap ★★★★★
()
Ответ на: комментарий от AITap
=== START OF INFORMATION SECTION ===
Device Model:     SAMSUNG HD322GJ
Serial Number:    S2BJJ90B113939
Firmware Version: 1AR10001
User Capacity:    320 072 933 376 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 6
Local Time is:    Sun Jun 19 22:58:21 2011 MSD
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                ( 2940) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  49) minutes.
SCT capabilities:              (0x003f) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   051    Pre-fail  Always       -       3666
  2 Throughput_Performance  0x0026   252   252   000    Old_age   Always       -       0
  3 Spin_Up_Time            0x0023   085   084   025    Pre-fail  Always       -       4836
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       75
  5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   252   252   051    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       2075
 10 Spin_Retry_Count        0x0032   252   252   051    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       23
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       69
191 G-Sense_Error_Rate      0x0022   100   100   000    Old_age   Always       -       2
192 Power-Off_Retract_Count 0x0022   252   252   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0002   064   059   000    Old_age   Always       -       36 (Min/Max 15/41)
195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       8
198 Offline_Uncorrectable   0x0030   252   252   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0036   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x002a   100   100   000    Old_age   Always       -       4
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       23
225 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       98

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


Note: selective self-test log revision number (0) not 1 implies that no selective self-test has ever been run
SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Completed [00% left] (0-65535)
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
mityash
() автор топика
Ответ на: комментарий от AITap

и спасибо :)

блин..вроде недавно покупал жесткий. вообще первый раз в жизни у меня он сыпется))

mityash
() автор топика
Ответ на: комментарий от mityash

> 5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0

196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0

Нехорошо, он должен их ремапить.

197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 8

Итого 8 битых секторов. Следите за этим значением, если начнёт расти - это плохо.

198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0

0. Уже хорошо. Если ЭТО начнёт расти, можно заворачиваться в простыню и ползти на кладбище.

Если MHDD в режиме REMAP зависает, можно попробовать ERASE на отдельные сектора, всё равно информация в них уже потеряна.

Происходили ли с диском какие-либо нарушения правил эксплуатации, вроде внезапных включений питания, вибрации, нарушения температурного режима?

AITap ★★★★★
()
Ответ на: комментарий от AITap

ну было пару resetов )
а так он в спокойном месте стоит, так что он вполне неплохо живет.

ошибка появилась после адекватного завершения работы вроде.(sudo halt)
спасибо. седня-завтра погоняю винт через sysrescue
диск на гарантии так что вроде не сильно страшно)
спасибо еще раз)

mityash
() автор топика
Ответ на: комментарий от mityash

Если диск не хочет ремапить плохие сектора, значит их нет. Подключи диск к другому порту, возможно умирает контроллер и порт начал глючить.

i-rinat ★★★★★
()
Ответ на: комментарий от AITap

после fsck:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE                                              
  1 Raw_Read_Error_Rate     0x002f   100   100   051    Pre-fail  Always       -       3762                                                   
  2 Throughput_Performance  0x0026   252   252   000    Old_age   Always       -       0
  3 Spin_Up_Time            0x0023   085   084   025    Pre-fail  Always       -       4774
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       80
  5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   252   252   051    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       2127
 10 Spin_Retry_Count        0x0032   252   252   051    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       24
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       74
191 G-Sense_Error_Rate      0x0022   100   100   000    Old_age   Always       -       2
192 Power-Off_Retract_Count 0x0022   252   252   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0002   064   059   000    Old_age   Always       -       36 (Min/Max 15/41)
195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       7
198 Offline_Uncorrectable   0x0030   252   252   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0036   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x002a   100   100   000    Old_age   Always       -       4
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       24
225 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       104

mityash
() автор топика
Ответ на: комментарий от mityash

> 5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0

196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0

Всё ещё 0. Жёсткий диск должен ремапить битые сектора! обязательно натравите на него MHDD в режиме REMAP.

197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 7

А было 8. Куда 1 делся? ⨀_⨀

198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0

0. Это хорошо.

AITap ★★★★★
()
Ответ на: комментарий от AITap

после fsck, правда там было предупреждение что раздел подмоунчен)

да, вот мне тоже интересно куда он делся. сказали что такие сектора могут появляться при неправильном завершении работы, и предлагали их просто забить нулями.

сегодня натравлю MHDD, просто времени не было на него)

и останутся ли данные на диске, или надо все переносить обязательно?

mityash
() автор топика
Ответ на: комментарий от mityash

> правда там было предупреждение что раздел подмоунчен)
Надеюсь, Вы не нажимали «исправить ошибки» на подмонтированном разделе?

Я же предупреждал: fsck нужно запускать с livecd!

и останутся ли данные на диске, или надо все переносить обязательно?

Данные в битых секторах потеряны. SCAN в режиме REMAP не уничтожает данные. ERASE - уничтожает, но более, чем на 1 (испорченный) сектор, её натравлять не нужно.
Если работать внимательно и аккуратно, данные останутся.

Но лучше сделать бекап. А вдруг там что-то совсем нехорошее с поверхностью, и дисковая активность приведёт к появлению новых бэд-блоков?

AITap ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.