LINUX.ORG.RU
ФорумAdmin

Объяснение падения сети?


0

2
brctl show
bridge name	bridge id		STP enabled	interfaces
br0		8000.84c9b27d9355	no		eth2
							vnet0
							vnet1
							vnet2
virbr0		8000.000000000000	yes		
  • eth2: VT6105/VT6106S [Rhine-III];
  • vnetX: Домены KVM.

Неисправность проявляется как изоляция хоста от ЛВС. Домены и Хост видят друг-друга. В этот момент в syslog (выборка по ощущению причастности к проблеме):

...
------------[ cut here ]------------
Dec 19 12:42:21 zevs kernel: [172825.234632] WARNING: at /build/buildd/linux-3.0.0/net/sched/sch_generic.c:255 dev_watchdog+0x25a/0x270()
Dec 19 12:42:21 zevs kernel: [172825.234635] Hardware name: System Product Name
Dec 19 12:42:21 zevs kernel: [172825.234637] NETDEV WATCHDOG: eth2 (via-rhine): transmit queue 0 timed out
Dec 19 12:42:21 zevs kernel: [172825.234640] Modules linked in: ip6table_filter ip6_tables ipt_MASQUERADE iptable_nat nf_nat nf_conntrack_ipv4 nf_defrag_ipv4 xt_state nf_conntrack ipt_REJECT 
xt_CHECKSUM iptable_mangle xt_tcpudp iptable_filter ip_tables x_tables snd_hda_codec_hdmi snd_hda_codec_realtek kvm_intel kvm bridge stp snd_hda_intel psmouse eeepc_wmi asus_wmi sparse_keymap
 i915 drm_kms_helper lp parport serio_raw pl2303 usbserial snd_hda_codec snd_hwdep snd_pcm snd_timer snd soundcore snd_page_alloc mei(C) drm i2c_algo_bit video wmi raid10 raid456 async_pq asy
nc_xor xor async_memcpy async_raid6_recov xhci_hcd via_rhine atl1c ahci libahci pata_via raid6_pq async_tx raid1 raid0 multipath linear
Dec 19 12:42:21 zevs kernel: [172825.234694] Pid: 0, comm: swapper Tainted: G         C  3.0.0-12-server #20-Ubuntu
Dec 19 12:42:21 zevs kernel: [172825.234696] Call Trace:
Dec 19 12:42:21 zevs kernel: [172825.234698]  <IRQ>  [<ffffffff8105e81f>] warn_slowpath_common+0x7f/0xc0
Dec 19 12:42:21 zevs kernel: [172825.234709]  [<ffffffff8105e916>] warn_slowpath_fmt+0x46/0x50
Dec 19 12:42:21 zevs kernel: [172825.234714]  [<ffffffff81507f7a>] dev_watchdog+0x25a/0x270
Dec 19 12:42:21 zevs kernel: [172825.234719]  [<ffffffff81011523>] ? native_sched_clock+0x13/0x60
Dec 19 12:42:21 zevs kernel: [172825.234724]  [<ffffffff81079d30>] ? __queue_work+0x320/0x320
Dec 19 12:42:21 zevs kernel: [172825.234728]  [<ffffffff81507d20>] ? qdisc_reset+0x50/0x50
Dec 19 12:42:21 zevs kernel: [172825.234732]  [<ffffffff81507d20>] ? qdisc_reset+0x50/0x50
Dec 19 12:42:21 zevs kernel: [172825.234737]  [<ffffffff8106d306>] call_timer_fn+0x46/0x160
Dec 19 12:42:21 zevs kernel: [172825.234741]  [<ffffffff81507d20>] ? qdisc_reset+0x50/0x50
Dec 19 12:42:21 zevs kernel: [172825.234744]  [<ffffffff8106ec32>] run_timer_softirq+0x132/0x2a0
Dec 19 12:42:21 zevs kernel: [172825.234749]  [<ffffffff81026add>] ? lapic_next_event+0x1d/0x30
Dec 19 12:42:21 zevs kernel: [172825.234753]  [<ffffffff81065e38>] __do_softirq+0xa8/0x210
Dec 19 12:42:21 zevs kernel: [172825.234758]  [<ffffffff8109321f>] ? tick_program_event+0x1f/0x30
Dec 19 12:42:21 zevs kernel: [172825.234764]  [<ffffffff81607e1c>] call_softirq+0x1c/0x30
Dec 19 12:42:21 zevs kernel: [172825.234770]  [<ffffffff8106621e>] irq_exit+0x8e/0xb0
Dec 19 12:42:21 zevs kernel: [172825.234774]  [<ffffffff8160875e>] smp_apic_timer_interrupt+0x6e/0x99
Dec 19 12:42:21 zevs kernel: [172825.234778]  [<ffffffff816075d3>] apic_timer_interrupt+0x13/0x20
Dec 19 12:42:21 zevs kernel: [172825.234780]  <EOI>  [<ffffffff810329a9>] ? default_spin_lock_flags+0x9/0x10
Dec 19 12:42:21 zevs kernel: [172825.234789]  [<ffffffff81347e7b>] ? intel_idle+0xcb/0x120
Dec 19 12:42:21 zevs kernel: [172825.234794]  [<ffffffff81347e5d>] ? intel_idle+0xad/0x120
Dec 19 12:42:21 zevs kernel: [172825.234799]  [<ffffffff814bcba2>] cpuidle_idle_call+0xa2/0x1d0
Dec 19 12:42:21 zevs kernel: [172825.234805]  [<ffffffff8100920b>] cpu_idle+0xab/0x100
Dec 19 12:42:21 zevs kernel: [172825.234809]  [<ffffffff815c8c0e>] rest_init+0x72/0x74
Dec 19 12:42:21 zevs kernel: [172825.234815]  [<ffffffff81ce6c2b>] start_kernel+0x3d4/0x3df
Dec 19 12:42:21 zevs kernel: [172825.234819]  [<ffffffff81ce6388>] x86_64_start_reservations+0x132/0x136
Dec 19 12:42:21 zevs kernel: [172825.234823]  [<ffffffff81ce6140>] ? early_idt_handlers+0x140/0x140
Dec 19 12:42:21 zevs kernel: [172825.234827]  [<ffffffff81ce6459>] x86_64_start_kernel+0xcd/0xdc
Dec 19 12:42:21 zevs kernel: [172825.234830] ---[ end trace 773e8e4010e6b2de ]---
...
...
Dec 19 12:42:21 zevs kernel: [172825.234982] via-rhine 0000:09:00.0: eth2: Transmit timed out, status 0003, PHY status 786d, resetting...
Dec 19 12:42:21 zevs kernel: [172825.235686] via-rhine 0000:09:00.0: eth2: link up, 100Mbps, full-duplex, lpa 0x45E1
...
Помогает только reboot. Карта не справляется с нагрузкой или APIC?

description: Motherboard
product: P8H67-V
Linux zevs 3.0.0-12-server #20-Ubuntu SMP Fri Oct 7 16:36:30 UTC 2011 x86_64 x86_64 x86_64 GNU/Linux
★★★★★

Последнее исправление: petav (всего исправлений: 4)

Скорее всего APIC не причем на eth0 внешне такие же проблемы были

           CPU0       CPU1       CPU2       CPU3       
  0:         60          0          0          0   IO-APIC-edge      timer
  1:          4          0          0          0   IO-APIC-edge      i8042
  8:          1          0          0          0   IO-APIC-edge      rtc0
  9:          0          0          0          0   IO-APIC-fasteoi   acpi
 12:          6          0          0          0   IO-APIC-edge      i8042
 16:          0          0          0          0   IO-APIC-fasteoi   pata_via
 19:    1433275          0          0          0   IO-APIC-fasteoi   eth2
 21:         12          0          0          0   IO-APIC-fasteoi   mei
 23:      12169          0          0          0   IO-APIC-fasteoi   ehci_hcd:usb1, ehci_hcd:usb2
 40:          0          0          0          0   PCI-MSI-edge      PCIe PME
 41:          0          0          0          0   PCI-MSI-edge      PCIe PME
 42:          0          0          0          0   PCI-MSI-edge      PCIe PME
 43:          0          0          0          0   PCI-MSI-edge      PCIe PME
 44:          0          0          0          0   PCI-MSI-edge      PCIe PME
 45:          0          0          0          0   PCI-MSI-edge      PCIe PME
 46:          0          0          0          0   PCI-MSI-edge      PCIe PME
 47:      14795     249750          0          0   PCI-MSI-edge      ahci
 48:          0          0          0          0   PCI-MSI-edge      xhci_hcd
 49:          0          0          0          0   PCI-MSI-edge      xhci_hcd
 50:          0          0          0          0   PCI-MSI-edge      xhci_hcd
 51:          0          0          0          0   PCI-MSI-edge      xhci_hcd
 52:          0          0          0          0   PCI-MSI-edge      xhci_hcd
 53:      43326          0          0          0   PCI-MSI-edge      i915
 54:       3821          0          0          0   PCI-MSI-edge      eth0
 55:        345          0          0          0   PCI-MSI-edge      hda_intel
NMI:          0          0          0          0   Non-maskable interrupts
LOC:    9074289    7872315    6117499    3982111   Local timer interrupts
SPU:          0          0          0          0   Spurious interrupts
PMI:          0          0          0          0   Performance monitoring interrupts
IWI:          0          0          0          0   IRQ work interrupts
RES:    3495649    3222784    2814169    2615052   Rescheduling interrupts
CAL:     826433     702077     524994     438528   Function call interrupts
TLB:     167517     191527     203447     222092   TLB shootdowns
TRM:          0          0          0          0   Thermal event interrupts
THR:          0          0          0          0   Threshold APIC interrupts
MCE:          0          0          0          0   Machine check exceptions
MCP:         18         18         18         18   Machine check polls
ERR:          0
MIS:          0

petav ★★★★★
() автор топика
Последнее исправление: petav (всего исправлений: 1)

Сразу скажу - пальцем в небо.

Я подобное ловил, но было связано с высокой нагрузкой на HDD. Примерно такие же симптомы. Вылечилось обновлением ядра. Попробуй.

Kroz ★★★★★
()
Ответ на: комментарий от zgen

Я сам это понимаю, но это наверное предвзято. На этой AR8151 v2.0 Gigabit Ethernet карте картина такая же была

petav ★★★★★
() автор топика
Ответ на: комментарий от petav

Но подробностей(логов) нет

petav ★★★★★
() автор топика
Ответ на: комментарий от Kroz

Я подобное ловил, но было связано с высокой нагрузкой на HDD

Нагрузки на HDD вовсе нет

Вылечилось обновлением ядра

Спасибо, но в крайнем случае

petav ★★★★★
() автор топика
Ответ на: комментарий от petav

Я вообще зарекся что-либо кроме интел ставить в сервера. Если сервера брендовые, от хп к примеру, то там идет броадком, тоже ничего в общем. А остальное от лукавого.

blind_oracle ★★★★★
()
Ответ на: комментарий от blind_oracle

Я вообще зарекся что-либо кроме интел ставить в сервера

Аналогично! Телега не совсем моя, наследство.

petav ★★★★★
() автор топика
Ответ на: комментарий от zgen

Исключим карту во всяком случае

petav ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.