LINUX.ORG.RU

Ответ на: комментарий от gserg

Вроде живые.
Впрочем, мне кажется, что даже если они сдохнут, то машина от этого не умрет.

Stahl ★★☆
() автор топика
Ответ на: комментарий от Stahl

ну тогда на контроллер посмотри, и еще в сторону перегрева. RAID какого уровня? Что показывает в мониторинге?

gserg ★★
()
Ответ на: комментарий от gserg

рейд зеркалка.
А что от мониторинга можно добиться, кроме как «Все ок» или «Все плохо»?

sudo tw_cli info c2 u0 status
/c2/u0 status = OK

Stahl ★★☆
() автор топика

Очень похоже на конфликт IRQ. Смотрели /proc/interrupts? У меня было подобное c Wmware ESX с RAID-ом от Adaptec (5405) в платформе 5015 от Supermicro. Попробуйте посмотреть, не появились ли новые версии BIOS для Вашей мат. платы. Если нет, можете попробовать поиграться с параметрами загрузки ядра, связанными с IRQ (noapic, irqbalance и т. п.). Хотя мне это не помогло. Еще вариант - попробовать поменять слот контроллера (если есть неколько подходящих).

Удачи!

anonymous
()

А я за простую мысль, что сдыхает БП.

athost ★★★★★
()
Ответ на: комментарий от anonymous
          CPU0       CPU1       CPU2       CPU3                                                                                                                                   
  0:         36          0          0          1   IO-APIC-edge      timer                                                                                                         
  1:          1          0          1          0   IO-APIC-edge      i8042                                                                                                         
  4:          0          1          0          0   IO-APIC-edge                                                                                                                    
  6:          1          0          2          1   IO-APIC-edge      floppy                                                                                                        
  8:          0          0          0          0   IO-APIC-edge      rtc0                                                                                                          
  9:          0          0          0          0   IO-APIC-fasteoi   acpi                                                                                                          
 12:          2          2          0          0   IO-APIC-edge      i8042                                                                                                         
 16:       9443       9435       9390       9395   IO-APIC-fasteoi   uhci_hcd:usb2, uhci_hcd:usb8, 3w-9xxx, pata_marvell                                                           
 18:          0          1          1          0   IO-APIC-fasteoi   ehci_hcd:usb1, uhci_hcd:usb7                                                                                  
 19:          0          0          0          0   IO-APIC-fasteoi   uhci_hcd:usb6, ata_piix, ata_piix                                                                             
 21:          0          0          0          0   IO-APIC-fasteoi   uhci_hcd:usb3                                                                                                 
 22:         44         43         44         44   IO-APIC-fasteoi   HDA Intel                                                                                                     
 23:          0          0          0          0   IO-APIC-fasteoi   ehci_hcd:usb4, uhci_hcd:usb5                                                                                  
1275:       8918       8928       8971       8968   PCI-MSI-edge      eth0                                                                                                         
NMI:          0          0          0          0   Non-maskable interrupts                                                                                                         
LOC:     125082     125180     135252      81358   Local timer interrupts                                                                                                          
RES:       1001        814        904        757   Rescheduling interrupts                                                                                                         
CAL:        197        250        238        188   function call interrupts                                                                                                        
TLB:       1401       1957       1384       1806   TLB shootdowns                                                                                                                  
TRM:          0          0          0          0   Thermal event interrupts                                                                                                        
THR:          0          0          0          0   Threshold APIC interrupts                                                                                                       
SPU:          0          0          0          0   Spurious interrupts                                                                                                             
ERR:          0                                                                                                                                                                    
                                                                                                                                                                                   
                                                                       

Даже не знаю, что тут может быть страшного. Пару ЮСБшек и какой-то марвелл..

БП? Тестера под рукой нет, можно как-то иначе узнать состояние БП?

Stahl ★★☆
() автор топика
Ответ на: комментарий от Stahl

> 16: 9443 9435 9390 9395 IO-APIC-fasteoi uhci_hcd:usb2, uhci_hcd:usb8, 3w-9xxx, pata_marvell

Вот это как раз и страшно. У Вас на 16-м IRQ висят 2 контроллера (IDE-контроллер Marvell и RAID 3ware) плюс USB. Если не поможет то, что я выше советовал, попробуйте поотключать USB и PATA в BIOS. Ну или выгрузить соответствующие модули.

anonymous
()

если IBM то в биосе выставь память принудительно а не авто )))) думаю поможет.

anonymous
()
Ответ на: комментарий от anonymous

Ну что же. Оторвал и заблокировал все лишнее.
Жду очередной смерти:)

Stahl ★★☆
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.