LINUX.ORG.RU

Глюк NFS?


0

0

Не совсем понимаю, что произошло. Шел довольно интенсивный обмен данными по NFS, плюс висела ssh сессия, более ничего страшного не делал, газетку читал, на экран поглядывая. Ни с того, ни с сего рушатся Xы, в логе вот что:


/var/log/messages:
Jan 16 21:21:12 hp smartd[3576]: Device: /dev/sda, SMART Usage Attribute: 194 Temperature_Celsius changed from 148 to 157
Jan 16 21:22:40 hp kernel: CCMP: decrypt failed: STA=00:1b:11:fa:b9:6a
Jan 16 21:23:32 hp kdm[2795]: X server for display :0 terminated unexpectedly
Jan 16 21:23:43 hp kernel: /jbd/transaction.c, 539): do_get_write_access: buffer_head d42ec2a8, force_copy 0
Jan 16 21:23:43 hp kernel: (fs/jbd/revoke.c, 428): journal_cancel_revoke: journal_head d42ec2a8, cancelling revoke
Jan 16 21:23:43 hp kernel: (fs/jbd/transaction.c, 1117): journal_dirty_metadata: journal_head d42ec2a8
Jan 16 21:23:43 hp kernel: (fs/jbd/transaction.c, 1341): journal_stop: h_ref 2 -> 1
Jan 16 21:23:43 hp kernel: (fs/jbd/transaction.c, 539): do_get_write_access: buffer_head d42ecd04, force_copy 1
Jan 16 21:23:43 hp kernel: (fs/jbd/revoke.c, 428): journal_cancel_revoke: journal_head d42ecd04, cancelling revoke
Jan 16 21:23:43 hp kernel: (fs/jbd/transaction.c, 1117): journal_dirty_metadata: journal_head d42ecd04
Jan 16 21:23:43 hp kernel: (fs/jbd/transaction.c, 539): do_get_write_access: buffer_head d5456c00, force_copy 0
Jan 16 21:23:43 hp kernel: (fs/jbd/revoke.c, 428): journal_cancel_revoke: journal_head d5456c00, cancelling revoke
Jan 16 21:23:43 hp kernel: (fs/jbd/transaction.c, 1117): journal_dirty_metadata: journal_head d5456c00
Jan 16 21:23:43 hp kernel: (fs/ext3/inode.c, 3152): ext3_dirty_inode: marking dirty. outer handle=e1023374
Jan 16 21:23:43 hp kernel: (fs/jbd/transaction.c, 539): do_get_write_access: buffer_head d42ec2a8, force_copy 0
Jan 16 21:23:43 hp kernel: (fs/jbd/revoke.c, 428): journal_cancel_revoke: journal_head d42ec2a8, cancelling revoke
Jan 16 21:23:43 hp kernel: (fs/jbd/transaction.c, 1117): journal_dirty_metadata: journal_head d42ec2a8
Jan 16 21:23:43 hp kernel: (fs/jbd/transaction.c, 1341): journal_stop: h_ref 2 -> 1
Jan 16 21:23:43 hp kernel: (fs/jbd/transaction.c, 539): do_get_write_access: buffer_head f78ffc00, force_copy 0
Jan 16 21:23:43 hp kernel: (fs/jbd/revoke.c, 428): journal_cancel_revoke: journal_head f78ffc00, cancelling revoke
Jan 16 21:23:43 hp kernel: (fs/jbd/transaction.c, 539): do_get_write_access: buffer_head d42ec2a8, force_copy 0
Jan 16 21:23:43 hp kernel: (fs/jbd/revoke.c, 428): journal_cancel_revoke: journal_head d42ec2a8, cancelling revoke


и дальше этого добра на 98 метров.

Иксы перезапустились, но в ядерный лог продолжает сыпать эти сообщения. После перезагрузки вроде все спокойно, fsck не делал пока. Локальная система:
Linux hp 2.6.22.5-31-default #1 SMP 2007/09/21 22:29:00 UTC i686 i686 i386 GNU/Linux
openSUSE 10.3
Локальная ФС: ext3

Что это было? И как лечить?

★★

А, не, похоже сначала иксы рухнули, в /var/log/kdm.log видимо к этому событию относится:

Backtrace:
0: /usr/bin/Xorg(xf86SigHandler+0x81) [0x80d5491]
1: [0xffffe420]
2: /usr/lib/xorg/modules//libfb.so(fbCreatePixmap+0x52) [0xb7a35142]
3: /usr/lib/xorg/modules//libxaa.so [0xb79c8f8a]
4: /usr/bin/Xorg(ProcCreatePixmap+0x10d) [0x808a08d]
5: /usr/bin/Xorg [0x8154b2e]
6: /usr/bin/Xorg(Dispatch+0x1af) [0x808ef6f]
7: /usr/bin/Xorg(main+0x47e) [0x8076a5e]
8: /lib/libc.so.6(__libc_start_main+0xe0) [0xb7cf3fe0]
9: /usr/bin/Xorg(FontFileCompleteXLFD+0x1ed) [0x8075de1]

Fatal server error:
Caught signal 11. Server aborting

MadCAD ★★
() автор топика

А жесткий диск то жив??? Не воспламенился?

gena2x ★★★
()

Я правильно понимаю, что "Temperature_Celsius changed from 148 to 157" -- это сообщение о повышении температуры HDD со 148° до 157° по Цельсию? Если да, то с железом что-то, мягко говоря, не то

dexpl ★★★★★
()
Ответ на: комментарий от dexpl

хм, разве смарт выдает именно значения, а не условные попугаи?

По smartctl кажет:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   062    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   040    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   253   100   033    Pre-fail  Always       -       1
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       201
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   040    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       304
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       108
191 G-Sense_Error_Rate      0x000a   100   099   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       3
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       647
194 Temperature_Celsius     0x0002   148   100   000    Old_age   Always       -       37 (Lifetime Min/Max 16/45)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   253   000    Old_age   Always       -       0
223 Load_Retry_Count        0x000a   100   100   000    Old_age   Always       -       0

Это больше похоже на правду - 37 цельсиев.

MadCAD ★★
() автор топика
Ответ на: комментарий от Gharik

Спасибо, не надо мне этого счастья, к тому же на ноуте

MadCAD ★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.