LINUX.ORG.RU

[SWNCQ]? Проблема с HDD - перемонтируется в режим «только чтение».


0

1

Имею следующую проблему на винте ATA WDC WD6400AADS-00M2B0 с материнкой ASUS M2N-E.

Какое-то время система работает нормально, потом насыпает в dmesg примерно следующее:

[  168.206530] ata7: EH in SWNCQ mode,QC:qc_active 0x8 sactive 0x8
[  168.206534] ata7: SWNCQ:qc_active 0x8 defer_bits 0x0 last_issue_tag 0x3
[  168.206535]   dhfis 0x8 dmafis 0x8 sdbfis 0x0
[  168.206537] ata7: ATA_REG 0x41 ERR_REG 0x84
[  168.206539] ata7: tag : dhfis dmafis sdbfis sacitve
[  168.206541] ata7: tag 0x3: 1 1 0 1  
[  168.206548] ata7.00: exception Emask 0x1 SAct 0x8 SErr 0x400000 action 0x6 frozen
[  168.206550] ata7.00: Ata error. fis:0x21
[  168.206552] ata7: SError: { Handshk }
[  168.206554] ata7.00: failed command: WRITE FPDMA QUEUED
[  168.206559] ata7.00: cmd 61/68:18:a7:01:44/00:00:25:00:00/40 tag 3 ncq 53248 out
[  168.206560]          res 41/84:1c:a7:01:44/84:00:25:00:00/40 Emask 0x10 (ATA bus error)
[  168.206562] ata7.00: status: { DRDY ERR }
[  168.206564] ata7.00: error: { ICRC ABRT }
[  168.206567] ata7: hard resetting link
[  168.206569] ata7: nv: skipping hardreset on occupied port
[  168.690033] ata7: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[  168.730647] ata7.00: configured for UDMA/133
[  168.730656] ata7: EH complete
[  229.144898] ata7: EH in SWNCQ mode,QC:qc_active 0x7FFFFFEF sactive 0x7FFFFFEF
[  229.144903] ata7: SWNCQ:qc_active 0x1E0 defer_bits 0x7FFFFE0F last_issue_tag 0x8
[  229.144904]   dhfis 0x1E0 dmafis 0x20 sdbfis 0x10
[  229.144906] ata7: ATA_REG 0x41 ERR_REG 0x84
[  229.144908] ata7: tag : dhfis dmafis sdbfis sacitve
[  229.144910] ata7: tag 0x5: 1 1 0 1  
[  229.144911] ata7: tag 0x6: 1 0 0 1  
[  229.144913] ata7: tag 0x7: 1 0 0 1  
[  229.144915] ata7: tag 0x8: 1 0 0 1  
[  229.144923] ata7.00: exception Emask 0x1 SAct 0x7fffffef SErr 0x400000 action 0x6 frozen
[  229.144925] ata7.00: Ata error. fis:0x21
[  229.144927] ata7: SError: { Handshk }
[  229.144930] ata7.00: failed command: WRITE FPDMA QUEUED
[  229.144934] ata7.00: cmd 61/08:00:e7:02:44/00:00:25:00:00/40 tag 0 ncq 4096 out
[  229.144935]          res 41/84:44:77:02:44/84:00:25:00:00/40 Emask 0x10 (ATA bus error)
[  229.144937] ata7.00: status: { DRDY ERR }
[  229.144939] ata7.00: error: { ICRC ABRT }
[  229.144941] ata7.00: failed command: WRITE FPDMA QUEUED
[  229.144945] ata7.00: cmd 61/08:08:37:03:44/00:00:25:00:00/40 tag 1 ncq 4096 out
[  229.144946]          res 41/84:44:77:02:44/84:00:25:00:00/40 Emask 0x10 (ATA bus error)
[  229.144948] ata7.00: status: { DRDY ERR }
[  229.144949] ata7.00: error: { ICRC ABRT }
[  229.144951] ata7.00: failed command: WRITE FPDMA QUEUED
[  229.144955] ata7.00: cmd 61/b8:10:3f:03:44/02:00:25:00:00/40 tag 2 ncq 356352 out
[  229.144956]          res 41/84:44:77:02:44/84:00:25:00:00/40 Emask 0x10 (ATA bus error)
[  229.144959] ata7.00: status: { DRDY ERR }
[  229.144961] ata7.00: error: { ICRC ABRT }
[  229.144963] ata7.00: failed command: WRITE FPDMA QUEUED
[  229.144967] ata7.00: cmd 61/10:18:f7:05:44/02:00:25:00:00/40 tag 3 ncq 270336 out
[  229.144968]          res 41/84:44:77:02:44/84:00:25:00:00/40 Emask 0x10 (ATA bus error)
[  229.144970] ata7.00: status: { DRDY ERR }
[  229.144972] ata7.00: error: { ICRC ABRT }
[  229.144974] ata7.00: failed command: WRITE FPDMA QUEUED
[  229.144978] ata7.00: cmd 61/08:28:5f:02:44/00:00:25:00:00/40 tag 5 ncq 4096 out
[  229.144979]          res 41/84:44:77:02:44/84:00:25:00:00/40 Emask 0x10 (ATA bus error)
ну и так далее
После чего перемонтирует диск в режим ro.

SMART уверяет что все нормально. fsck тоже не видит никаких проблем. Диск не разбит - один единственный основной раздел на весь винт.

Куда копать?

Ядро убунтовское 2.6.38-13-generic.

Раньше проблем не возникало.

ASUS M2N-E

Хорошо бы проверить, как на этой матери работают другие винты. Думаю, что дело в матери. Неделю назад держал в руках такую же мать, у которой отвалился пластмассовый штырёк крепления радиатора на чипсете. В итоге, сначала комп зависал на ровном месте, а потом и совсем умер. Может тут тоже идёт перегрев?

Jurik_Phys ★★★★★ ()
Ответ на: комментарий от Jurik_Phys

Не думаю, что это перегрев - непохоже это на него:

acpitz-virtual-0
Adapter: Virtual device
temp1:       +40.0°C  (crit = +75.0°C)                  

k8temp-pci-00c3
Adapter: PCI adapter
core0 temp:  +53.0°C                                    
core1 temp:  +47.0°C  
Хотя разница в температуре ядер настораживает - раньше такого вроде не было, но и камень был другой... Сейчас разгон уберу.

Разбирал системник с неделю назад - все там хорошо, но перепроверю - чего уж...

На этой же матери еще два винта - ATA WDC WD800JD-22MSA1 и ATA SAMSUNG HD321KJ. С ними проблем нет. Сейчас попробую контроллеры поменять (каждый на своем телепается так как их 3).

Suntechnic ★★★★★ ()
Ответ на: комментарий от Suntechnic

Ну вот 12 часов пока без проблем работает - а поменял-то просто шлейфы у WD800JD и проблемного WD6400AADS...

Suntechnic ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.