LINUX.ORG.RU

Жесткий диск умер или да


0

0

Столкнулся со следующей проблемой:

Вкратце: система повисла, перезагрузился, жесткий начал выделываться, ошибки с grub, потом жесткий совсем перестал определяться, я его достал, вытер килограмм пыли, двинул с ноги , после чего система загрузилась с большим срачем в dmesg:

Jun 13 13:04:28 freedom kernel: REISERFS warning: reiserfs-5082 is_leaf: free space seems wrong: level=1, nr_items=10, free_space=65524 rdkey[br]

Приложения при запуске писали «ro fs» и не запускались. Есть предположение, что битые сектора находятся на разделе с /home, т.к. после создания нового пользователя срач в dmesg прекратился.

Archlinux, 2.6.33





Последнее исправление: GenuS (всего исправлений: 1)

Ну и напоследок, тест smartctl:

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi Deskstar T7K250 series
Device Model:     HDT722516DLA380
Serial Number:    VDK71GTE0K8PBK
Firmware Version: V43OA96A
User Capacity:    164 696 555 520 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 1
Local Time is:    Sun Jun 13 19:23:59 2010 EEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (  25)	The self-test routine was aborted by
					the host.
Total time to complete Offline 
data collection: 		 (3385) seconds.
Offline data collection
capabilities: 			 (0x5b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 (  57) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   161   161   024    Pre-fail  Always       -       245 (Average 189)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       1937
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   020    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   097   097   000    Old_age   Always       -       22667
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       1913
192 Power-Off_Retract_Count 0x0032   098   098   050    Old_age   Always       -       2765
193 Load_Cycle_Count        0x0012   098   098   050    Old_age   Always       -       2765
194 Temperature_Celsius     0x0002   112   112   000    Old_age   Always       -       49 (Lifetime Min/Max 15/52)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   253   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Aborted by host               90%     22667         -

Warning! SMART Selective Self-Test Log Structure error: invalid SMART checksum.
SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Печально, но боюсь, что к нему пришла смерть с косой ( Может все-таки есть способы решить проблему, не выкидывая винт в окно ? :-)

GenuS
() автор топика
Ответ на: комментарий от GenuS

Печально но я боюсь что битых секторов нету

Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0

Диск мне сказал это строчкой выше.

А вот это

Temperature_Celsius 0x0002 112 112 000 Old_age Always - 49 (Lifetime Min/Max 15/52)

Говорит что ему еще три градуса и в вытрезвитель, на основнии чего моя телепатии сообщает что скорее всего он тупо перегрелся и отрубился, а рейзер из-за этого убил жен^W^W убился вусмерть и требует fsck, отчего и в ro

wfrr ★★☆
()

>>Temperature_Celsius 0x0002 112 112 000 Old_age Always - 49 (Lifetime Min/Max 15/52)

Говорит что ему еще три градуса и в вытрезвитель



нет, рабочие температуры надо смотреть в спеках, а это просто лог, что максимальный нагрев БЫЛ 52 градуса, за весь период пока диск эксплуатировался, это весьма хорошие условия, т.е. 52 градуса это совсем не предел.


Sylvia ★★★★★
()
Ответ на: комментарий от Sylvia

обычно пушной зверек приходит погреться при температурах винчестера > 60 градусов, и то как повезет, некоторые и под 70 ухитряются пользоваться, с отключенным SMART достаточно долго

Sylvia ★★★★★
()

> free space seems wrong: level=1, nr_items=10, free_space=65524 rdkey

А если сделать fsck?

ro fs

Так будет до тех пор, пока не сделаешь fsck, наверное.

Nixopatolog
()
Ответ на: комментарий от Quasar

>>REISERFS

А не с этим ли связано?

Что связано? То, что жесткий диск не определяется?

anonymous
()

Проверь диск викторией.

emaxx ★★
()
Ответ на: комментарий от GenuS

>22600 ч == ~2.5 года, это не шутки ))

Фи :) У меня в этом году (в августе) будет 15 лет непрерывной работы винту в старом серверочке :)

sS ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.