LINUX.ORG.RU
ФорумAdmin

Сетевушка NetXtreme II иногда вешает систему


0

0

Проболема раз - если поднять любой сетевой интерфейс, кроме нулевого, пишет:

Message from syslogd@localhost at Apr 2 09:29:57 ... kernel:[ 227.352979] Uhhuh. NMI received for unknown reason b1 on CPU 0.

Message from syslogd@localhost at Apr 2 09:29:57 ... kernel:[ 227.353044] You have some hardware problem, likely on the PCI bus.

Message from syslogd@localhost at Apr 2 09:29:57 ... kernel:[ 227.353106] Dazed and confused, but trying to continue

и сетевушка отключается. Иногда вместо этого случается kernel panic.

Проблема 2 - даже когда использую только один порт, если есть небольшая сетевая активность, в ядре появляется сообщение:

[121030.457885] eth0: Device temperature 100 degrees C exceeds maximum allowed. Hardware has been shut down. [121030.457939] eth1: Device temperature 100 degrees C exceeds maximum allowed. Hardware has been shut down. [121030.457990] eth2: Device temperature 100 degrees C exceeds maximum allowed. Hardware has been shut down. [121062.437873] netxen_nic: card response timeout. [121062.437902] netxen_nic: Failed to destroy rx ctx in firmware [121094.417869] netxen_nic: card response timeout. [121094.417898] netxen_nic: Failed to destroy tx ctx in firmware [121094.460703] eth3: Device temperature 100 degrees C exceeds maximum allowed. Hardware has been shut down.

Что есть явный бред. Тут в похожих темах просят показать это:

$ lspci -vs 06:00.0
06:00.0 Ethernet controller: NetXen Incorporated NX3031 Multifunction 1/10-Gigabit Server Adapter (rev 42)
        Subsystem: Hewlett-Packard Company NC375i Integrated Quad Port Multifunction Gigabit Server Adapter
        Flags: bus master, fast devsel, latency 0, IRQ 24
        Memory at fae00000 (64-bit, non-prefetchable) [size=2M]
        Memory at f8000000 (64-bit, non-prefetchable) [size=32M]
        Capabilities: <access denied>
        Kernel driver in use: netxen_nic
        Kernel modules: netxen_nic

$ dmesg |grep eth
[    1.796876] ACPI Error (psparse-0537): Method parse/execution failed [\_SB_._OSC] (Node ffff880426c14f20), AE_AML_BUFFER_LIMIT
[    2.432767] netxen_nic 0000:06:00.0: eth0: GbE port initialized
[    2.434177] netxen_nic 0000:06:00.1: eth1: GbE port initialized
[    2.435628] netxen_nic 0000:06:00.2: eth2: GbE port initialized
[    2.437115] netxen_nic 0000:06:00.3: eth3: GbE port initialized
[    8.754656] netxen_nic: eth0 NIC Link is up
[    8.755739] ADDRCONF(NETDEV_UP): eth0: link is not ready
[    8.760126] ADDRCONF(NETDEV_CHANGE): eth0: link becomes ready
[   19.319590] eth0: no IPv6 routers present

Стоит debian squeeze (в lenny эта сетевушка отказывается работать - требует новый пакет с бинарной прошивкой firmware-bnx2, который не работает без нового ядра). Обновлял постоянно уже недели 3 в надежде, что ошибка общая, а, значит, будет вскоре замечена и исправлена. На bugs.debian.org ничего похожего на мой случай не нашёл. Попытка собрать драйвер с официального сайта успехом не увенчалась (там захардкодено окружение RedHat или SLES), но если заглянуть в исходник драйвера, то видно, что там захардкодена та же бинарная прошивка. Машинка - HP ProLiant ML370 G6.

Куда копать дальше?

Ответ на: комментарий от power

Да

Так написано и в описание пакета, и в интернете по поводу этой сетевой карты.

lost_shadow ()
Ответ на: комментарий от power

Уже нет :(

Похоже, в описании сервера стоит BroadCom, а в комплекте идёт NetXen. Хм...

lost_shadow ()

Купи Intel Pro1000/PT на нужное число дырок и не мучайся. Если гигабиты ворочать собираешься на сетевой нельзя экономить.

tx ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.