LINUX.ORG.RU

Регулярная проблема с файловой системой


0

0

Всем привет.

Есть сервак:

- OS Centos 5.3 - 2 x SATA диска 500Gb (WDC WD5002ABYS-01B1B) - soft raid 1 (mirror)

Регулярно один из зеркалированных разделов (/home из sda1 + sdb1) переходит в read-only режим из-за найденных ошибок, лечится перезагрузкой и проверкой fsck'ом, но причина их появления так и не установлена.

Сама ошибка выглядит так:

Aug 25 12:50:20 kernel: EXT3-fs error (device md3): ext3_lookup: unlinked inode 65442296 in dir #65437697
Aug 25 12:50:20 kernel: Aborting journal on device md3.
Aug 25 12:50:20 kernel: journal commit I/O error
Aug 25 12:50:20 kernel: ext3_abort called.
Aug 25 12:50:20 kernel: EXT3-fs error (device md3): ext3_journal_start_sb: Detected aborted journal
Aug 25 12:50:20 kernel: Remounting filesystem read-only
Aug 25 12:50:20 kernel: EXT3-fs error (device md3): ext3_lookup: unlinked inode 65442296 in dir #65437697
Aug 25 12:50:20 kernel: EXT3-fs error (device md3): ext3_lookup: unlinked inode 65442296 in dir #65437697

Потом много ошибок такого вида:

Aug 25 12:53:40 kernel: BUG: soft lockup - CPU#0 stuck for 10s! [shutdown:32314]
Aug 25 12:53:40 kernel:
Aug 25 12:53:40 kernel: Pid: 32314, comm:             shutdown
Aug 25 12:53:40 kernel: EIP: 0060:[<c049a782>] CPU: 0
Aug 25 12:53:40 kernel: EIP is at dqput+0x88/0x15d
Aug 25 12:53:40 kernel:  EFLAGS: 00000246    Not tainted  
(2.6.18-128.4.1.el5PAE #1)
Aug 25 12:53:40 kernel: EAX: 00000000 EBX: ec8c7cc0 ECX: f7bce400 
EDX: 00000002
Aug 25 12:53:40 kernel: ESI: ec8c7cc0 EDI: f7bce4e4 EBP: ffffffff 
DS: 007b ES: 007b
Aug 25 12:53:40 kernel: CR0: 8005003b CR2: 0814b340 CR3: 1b0b87e0 CR4: 000006f0
Aug 25 12:53:40 kernel:  [<c049bc5a>] vfs_quota_sync+0x9b/0x131
Aug 25 12:53:40 kernel:  [<c049d9e1>] quota_sync_sb+0x11/0xcc
Aug 25 12:53:40 kernel:  [<c049db48>] sync_dquots+0xac/0xed
Aug 25 12:53:40 kernel:  [<c04737d8>] do_sync+0x1b/0x55
Aug 25 12:53:40 kernel:  [<c047381c>] sys_sync+0xa/0xd
Aug 25 12:53:40 kernel:  [<c0404f17>] syscall_call+0x7/0xb
Aug 25 12:53:40 kernel:  =======================

- В логах никаких ошибок кроме указанной нету

- S.M.A.R.T. обоих дисков девственно чистый

- bablocks обоих дисков и всего рейд раздела, ничего не находит

- В /etc/mdstat с рейдом все нормально

- Серваку несколько месяцев, диски и железо новое, питание от UPS, охлаждение и т.п. все как положено.

Есть идеи куда копать?

Ответ на: комментарий от Black_Shadow

Память прогонял мемтестом, все в норме.

Kalashmat
() автор топика

Проверьте блок питания, вольтметром. И сходите в гугл с названием вашей материнки, может уже есть у кого аналогичные проблемы. ИМХО, глюк в материнке или контроллере винтов, а сами винты в порядке.

mky ★★★★★
()

> Есть идеи куда копать?

Копнуть в сторону БИОС
У меня новая материнка ASUS M4A78, позавчера приобретенная, шла с древней версией бивиса и выкидывала фееричные по фантастичности глюки.
Проблема решилась обновлением.

dhameoelin ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.