LINUX.ORG.RU

Откидывается Intel e1000e на несколько секунд/вообще

 ,


0

2

Есть сервер который принимает интернет и раздает его в локальную сеть, с настройками все отлично. Linux Ubuntu Server 16.04.2. Dmesg вот что выдает:

[ 2871.756035] ------------[ cut here ]------------
[ 2871.756061] WARNING: CPU: 6 PID: 0 at /build/linux-9yOF0g/linux-4.4.0/net/sched/sch_generic.c:306 dev_watchdog

+0x237/0x240()
[ 2871.756079] NETDEV WATCHDOG: enp4s0f1 (e1000e): transmit queue 0 timed out
[ 2871.756086] Modules linked in: ipt_REJECT nf_reject_ipv4 xt_conntrack ipt_MASQUERADE nf_nat_masquerade_ipv4 

iptable_nat nf_conntrack_ipv4 nf_defrag_ipv4 nf_nat_ipv4 iptable_filter ip_tables x_tables ipmi_ssif coretemp 

kvm_intel kvm irqbypass serio_raw lpc_ich 8250_fintek shpchp i5000_edac edac_core mac_hid i5k_amb ipmi_si 

ipmi_msghandler nf_nat_pptp nf_nat_proto_gre nf_conntrack_pptp nf_conntrack_proto_gre nf_nat nf_conntrack ib_iser 

rdma_cm iw_cm ib_cm ib_sa ib_mad ib_core ib_addr iscsi_tcp libiscsi_tcp libiscsi scsi_transport_iscsi autofs4 btrfs 

raid10 raid456 async_raid6_recov async_memcpy async_pq async_xor async_tx xor raid6_pq libcrc32c raid1 raid0 

multipath linear amdkfd amd_iommu_v2 radeon i2c_algo_bit ttm drm_kms_helper syscopyarea sysfillrect sysimgblt 

fb_sys_fops ahci e1000e ptp psmouse
[ 2871.756148]  drm libahci pata_acpi pps_core fjes
[ 2871.756155] CPU: 6 PID: 0 Comm: swapper/6 Not tainted 4.4.0-66-generic #87-Ubuntu
[ 2871.756157] Hardware name: Intel S5000PSL/S5000PSL, BIOS S5000.86B.15.00.0101.110920101604 11/09/2010
[ 2871.756159]  0000000000000286 1c9657f6f918213b ffff88025fd83d98 ffffffff813f8083
[ 2871.756162]  ffff88025fd83de0 ffffffff81d6fd00 ffff88025fd83dd0 ffffffff810812d2
[ 2871.756165]  0000000000000000 ffff88003550dc80 0000000000000006 ffff880035074000
[ 2871.756167] Call Trace:
[ 2871.756170]  <IRQ>  [<ffffffff813f8083>] dump_stack+0x63/0x90
[ 2871.756179]  [<ffffffff810812d2>] warn_slowpath_common+0x82/0xc0
[ 2871.756182]  [<ffffffff8108136c>] warn_slowpath_fmt+0x5c/0x80
[ 2871.756185]  [<ffffffff81757967>] dev_watchdog+0x237/0x240
[ 2871.756188]  [<ffffffff81757730>] ? qdisc_rcu_free+0x40/0x40
[ 2871.756192]  [<ffffffff810ecd55>] call_timer_fn+0x35/0x120
[ 2871.756194]  [<ffffffff81757730>] ? qdisc_rcu_free+0x40/0x40
[ 2871.756197]  [<ffffffff810ed70a>] run_timer_softirq+0x23a/0x2f0
[ 2871.756200]  [<ffffffff81085db1>] __do_softirq+0x101/0x290
[ 2871.756202]  [<ffffffff810860b3>] irq_exit+0xa3/0xb0
[ 2871.756206]  [<ffffffff8183f0a2>] smp_apic_timer_interrupt+0x42/0x50
[ 2871.756210]  [<ffffffff8183d362>] apic_timer_interrupt+0x82/0x90
[ 2871.756211]  <EOI>  [<ffffffff816cf8de>] ? cpuidle_enter_state+0x10e/0x2b0
[ 2871.756217]  [<ffffffff816cfab7>] cpuidle_enter+0x17/0x20
[ 2871.756221]  [<ffffffff810c4522>] call_cpuidle+0x32/0x60
[ 2871.756223]  [<ffffffff816cfa93>] ? cpuidle_select+0x13/0x20
[ 2871.756225]  [<ffffffff810c47e0>] cpu_startup_entry+0x290/0x350
[ 2871.756228]  [<ffffffff810517c4>] start_secondary+0x154/0x190
[ 2871.756231] ---[ end trace 6fbe9fec0792e945 ]---
[ 2871.758481] e1000e 0000:04:00.1 enp4s0f1: Reset adapter unexpectedly
[ 2875.539366] e1000e: enp4s0f1 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
[ 3672.071450] perf interrupt took too long (2540 > 2500), lowering kernel.perf_event_max_sample_rate to 50000
[ 9647.160290] nf_conntrack: automatic helper assignment is deprecated and it will be removed soon. Use the 

iptables CT target to attach helpers instead.
[ 9854.844813] perf interrupt took too long (5005 > 5000), lowering kernel.perf_event_max_sample_rate to 25000
Все на мат. плате 2xe1000e, и оба страдают от этого, под виндой без разговоров в этот момент синяк с намеком на драйвер Intel Networking, есть второй сервер с такой же сетевухой, был под виндой, и так же синяки. Но винда для меня не кошерна. С утра сегодня интернетная отвалилась вообще(Локальная которая в логах отвалилась недавно на 4 секунды), пришлось перезапускать сервер.



Последнее исправление: Cherbet (всего исправлений: 5)

Ответ на: комментарий от wellcomer

Поставлю на внешку тогда сейчас 8169, а на внутренку 8139D(Ставить пока нечего более вменяемого). Что думаете?

Cherbet
() автор топика
Ответ на: комментарий от Cherbet

Опять выкинуло на пол минуты, в логах ничего, просто инет пропал.

Может быть собралось в кучу несколько проблем. У меня этот «Reset adapter unexpectedly» вызывал только кратковременный обрыв связи. Тоже проблема, но не так, чтобы отвалилось навсегда.

Интеренет как получается ? Прямое подключение, или PPP какой-нибудь ? Проверить бы изнутри, что точно на первом хопе проблема.

Поставь систему мониторинга какую-нибудь что ли. Можно будет тесты какие-то предусмотреть.

AS ★★★★★
()
Последнее исправление: AS (всего исправлений: 1)
Ответ на: комментарий от AS

Интернет от оператора по статик IP, я хостер PPTP, OpenVPN. Поставил 8169 и 8139D, как ни странно, все отлично, никаких потерянных пакетов, единственное в 8139D скорость скачивания только 28 мб/с, и выкачивания 90+ мб/с, где-то затык в самой карте, если нормально себя 8169 покажет, поставлю вторую. Сейчас стоит пингуется, потери пакетов нет за одинаковые промежутки времени. В первое время после перезагрузки почему-то не были доступны Samba, PPTP VPN, SSH

Cherbet
() автор топика
Ответ на: комментарий от Cherbet

Интернет от оператора по статик IP, я хостер PPTP, OpenVPN

PPTP и OpenVPN раздаются с одной карты, а статик IP - на другой ? И в последний разы изнутри сервер клиентам был доступен ?

скорость скачивания только 28 мб/с, и выкачивания 90+ мб/с, где-то затык в самой карте

Вообще-то Intel - более производительные карты. Надо только понять, что сейчас за проблема с ними. Кстати, что за карты ? lspci|grep -i "Ether.*Intel" покажи. По крайней мере скажу, есть ли у меня такие.

AS ★★★★★
()
Последнее исправление: AS (всего исправлений: 1)
Ответ на: комментарий от AS
04:00.0 Ethernet controller: Intel Corporation 80003ES2LAN Gigabit Ethernet Controller (Copper) (rev 01)
04:00.1 Ethernet controller: Intel Corporation 80003ES2LAN Gigabit Ethernet Controller (Copper) (rev 01)

Раздаются с двух(Локалка, Интернет, и lo интерфейс). Был доступен, поменял карты и изменил конфиг под них, перезагрузил и переключил кабеля, работало, но перезагрузил ещё раз и связка сервисов недоступна несколько минут. Позже все заработало как положенно.

Cherbet
() автор топика
Ответ на: комментарий от Cherbet

80003ES2LAN

Есть материнка с такими, но только одна. Сервер был хостситемой под OpenVZ контейнеры, сейчас в резерве фактически. Проблем не было, но ввиду специфики OpenVZ на нём и новых ядер не было. Да и сейчас 2.6.32 всё ещё. OpenV ядро собирают на базе актуального от RHEL, то есть, сильно пропатченого и достаточно нового, но не 3.x всё равно, и не 4.x. Драйвер e1000e версия 3.2.6-k сейчас. Кстати забавно, но у ванильного 4.1.21 версия e1000e 2.3.2-k.

Позже все заработало как положенно.

Без вмешательства ? Надо логи смотреть, что там как грузилось и где стояло.

AS ★★★★★
()
Ответ на: комментарий от Cherbet

Кстати количество dropped в ifconfig на локальном интерфейсе сократилось в очень много раз.

На Реалтеках ?

AS ★★★★★
()
Ответ на: комментарий от AS

Да без вмешательства, в логах чисто, попробую ещё раз перезагрузить в 5 часов, да на реалтеках, как ни странно.

Cherbet
() автор топика
Ответ на: комментарий от wellcomer

Да у меня и на Интеле было такое же.
Intel 82546EB, двухпортовка (pci-x 133, но была вкорячена в PCI)
Ресетилась ни с того ни с сего под нагрузкой, что на PCI-X, что в простом PCI.
Проблема решилась покупкой бу-шной Intel e350 на Ибее за 25 денег.

Myp3ik ★★
()
Последнее исправление: Myp3ik (всего исправлений: 1)
Ответ на: комментарий от Myp3ik

Я в PCI-X вставил 8139D)). 8169 у меня для pci-ex. Сейчас попробую перезапустить сервер, проверю в чем проблема.

Cherbet
() автор топика
Ответ на: комментарий от Cherbet

Вот, после только этого в логах все сервисы начинают работать как положенно

[  314.107734] audit_printk_skb: 15 callbacks suppressed
[  314.107739] audit: type=1400 audit(1489758349.205:17): apparmor="DENIED" operation="open" profile="/usr/sbin/mysqld" name="/proc/1469/status" pid=1469 comm="mysqld" requested_mask="r" denied_mask="r" fsuid=107 ouid=107
[  314.107780] audit: type=1400 audit(1489758349.205:18): apparmor="DENIED" operation="open" profile="/usr/sbin/mysqld" name="/sys/devices/system/node/" pid=1469 comm="mysqld" requested_mask="r" denied_mask="r" fsuid=107 ouid=0
[  314.107836] audit: type=1400 audit(1489758349.205:19): apparmor="DENIED" operation="open" profile="/usr/sbin/mysqld" name="/proc/1469/status" pid=1469 comm="mysqld" requested_mask="r" denied_mask="r" fsuid=107 ouid=107

Cherbet
() автор топика
Ответ на: комментарий от Cherbet

apparmor=«DENIED»

Хе-хе. Вот со всякими apparmor, политиками безопасности и т.п. - это тебе самостоятельно разбираться. Отдельная тема, которая к железу не относится.

AS ★★★★★
()
Ответ на: комментарий от AS

А че это оно вдруг вылезло, ибо до уставки карт такого небыло, теперь 300 секунд ждать пока запустится все

Cherbet
() автор топика
Ответ на: комментарий от Cherbet

А что делать то теперь, не уж то бежать на форум ubuntu?

Ну не знаю. Заведи тему в соседнем разделе (admin) про AppArmor в Ubuntu и тормоза после замены сетевых плат. Кто-то тут есть, наверное, кто пользуется.

AS ★★★★★
()
Ответ на: комментарий от Cherbet

Что делать то теперь.

Второй сервер чем занят ? Если пустует, попробуй туда серверный стартеркит ALT поставить. Нет AppArmor, не включен SELinux (плюс вообще можно selinux=0 в параметры ядра; но это везде, наверное, можно), в репозитории есть разные ядра, включая то, что у меня точно работает с такими сетевухами. Кстати, у тебя сколько мегабит трафик получается ?

AS ★★★★★
()
Ответ на: комментарий от AS

ALT вроде прикольный, но нет, репо мне не нравится их. Трафик 50 mb/s, до недавнего времени был 100, но пришлось понизить.

Cherbet
() автор топика
Ответ на: комментарий от Cherbet

Попробовал убрать из interfaces старые сетевые интерфейсы, посмотрим что будет, сейчас перезагрузил

Cherbet
() автор топика
Ответ на: комментарий от Cherbet

Лол, вот сейчас конечно смешно, но это помогло...

Cherbet
() автор топика
Ответ на: комментарий от Cherbet

Трафик 50 mb/s, до недавнего времени был 100, но пришлось понизить.

Так. Давай подробнее. Клиенты хотят и могут больше ? Где сделано ограничение ? В сторону клиентов, или на входе ? Кем ? Если шейпит оператор, отдающий трафик, а трафик упирается в потолок его шейпера, могут быть разные спецэффекты, если пытаться получить доступ к серверу снаружи же.

AS ★★★★★
()
Ответ на: комментарий от AS

Нет, оператор шейпит, но с этим все ок, ибо оператор толковый, корпоративный, звонит когда мультик отрублен, воот, а так внезапно удаление интерфейсов решило все проблемы

Cherbet
() автор топика
Ответ на: комментарий от Cherbet

ибо оператор толковый, корпоративный

Так от этого не зависит. Если ты в полосу упираешься, тебе будут пакеты дропать.

AS ★★★★★
()
Ответ на: комментарий от AS

Ну как мне сказали режут цыской, то есть достигает максимальной сначала скорости и потом работаешь шейпер.

Cherbet
() автор топика
Ответ на: комментарий от Cherbet

то есть достигает максимальной сначала скорости
и потом работаешь шейпер.

Так а я про что ? Максимум достигается, потом начинаются потери пакетов. Я и спрашиваю, в 50М упираешься, или нет ?

AS ★★★★★
()
Ответ на: комментарий от Cherbet

51+ упираюсь

Это не хорошо. Попробуй на интерфейсе в сторону клиентов сам сделать шейпер. Скажем, мегабит 49, чтобы запас был на неточности. И попробовать поставить какой-нибудь DPI, либо каким-то иным способом классифицировать какой-нибудь потенциально большой и вредный трафик (ага, торрент) и настроить QoS, понизив ему приоритет относительно всего остального.

AS ★★★★★
()
Ответ на: комментарий от Cherbet

Шейпер хотел поставить htb.init, что думаешь?

Не принципиально наверное. Проблема основная в классификации. Проект OpenDPI помер, так что придётся поискать, что использовать можно сейчас. У меня такая задача не стоит сейчас, потому я современное состояние в этой области в Linux знаю не на столько, чтобы что-то точно советовать.

AS ★★★★★
()
Ответ на: комментарий от AS

С шейпингом и обрезанием доступа к сайтом что с виндой беда, что с линухом... Буду смотреть. Спасибо всем. Если повторится с утра, то я отпишусь.

Cherbet
() автор топика
Ответ на: комментарий от AS

какой-нибудь потенциально большой и вредный трафик (ага, торрент) и настроить QoS

Правда эта хрень - торрент - она UDP, и внешний канал загаживать будет всё равно, даже если не будет долетать до пользователей, но, может, торрент-клиенты какие-то понятливые будут и сами что-то ограничат. Не знаю, как они сейчас работают в этом плане.

AS ★★★★★
()
Ответ на: комментарий от Cherbet

Да, вроде нормально сейчас все работает.

Cherbet
() автор топика
Ответ на: комментарий от AS

OpenDPI прибрал ntop/ndpi

есть реализация для netfilter, для части веток ядра даже не требуется патчить ядро.

vel ★★★★★
()
1 февраля 2018 г.

В конфиг GRUB добавить запись:

pcie_aspm=off

потом ребутнуть сервер.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.