LINUX.ORG.RU

iwlwifi крешится

 


0

1

С непонятной периодичностью, но стабильно не меньше двух раз в день крешится модуль iwlwifi.

В dmesg такая вот простыня:

 [249055.316852] wlan0: deauthenticated from 00:1d:73:b1:0a:b1 (Reason: 7)
[249055.373866] cfg80211: Calling CRDA to update world regulatory domain
[249055.376688] cfg80211: World regulatory domain updated:
[249055.376692] cfg80211:   (start_freq - end_freq @ bandwidth), (max_antenna_gain, max_eirp)
[249055.376695] cfg80211:   (2402000 KHz - 2472000 KHz @ 40000 KHz), (300 mBi, 2000 mBm)
[249055.376698] cfg80211:   (2457000 KHz - 2482000 KHz @ 20000 KHz), (300 mBi, 2000 mBm)
[249055.376700] cfg80211:   (2474000 KHz - 2494000 KHz @ 20000 KHz), (300 mBi, 2000 mBm)
[249055.376702] cfg80211:   (5170000 KHz - 5250000 KHz @ 40000 KHz), (300 mBi, 2000 mBm)
[249055.376704] cfg80211:   (5735000 KHz - 5835000 KHz @ 40000 KHz), (300 mBi, 2000 mBm)
[249055.385243] wlan0: authenticate with 00:1d:73:b1:0a:b1
[249055.386246] wlan0: send auth to 00:1d:73:b1:0a:b1 (try 1/3)
[249055.388426] wlan0: authenticated
[249055.389335] wlan0: associate with 00:1d:73:b1:0a:b1 (try 1/3)
[249055.392904] wlan0: RX AssocResp from 00:1d:73:b1:0a:b1 (capab=0x411 status=0 aid=1)
[249055.395430] wlan0: associated
[249101.376949] iwlwifi 0000:09:00.0: fail to flush all tx fifo queues Q 2
[249101.376960] iwlwifi 0000:09:00.0: Current SW read_ptr 4 write_ptr 19
[249101.377018] iwl data: 00000000: f0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00  ................
[249101.377058] iwlwifi 0000:09:00.0: FH TRBs(0) = 0x80003087
[249101.377100] iwlwifi 0000:09:00.0: FH TRBs(1) = 0x80102007
[249101.377147] iwlwifi 0000:09:00.0: FH TRBs(2) = 0x802010b3
[249101.377187] iwlwifi 0000:09:00.0: FH TRBs(3) = 0x80300031
[249101.377235] iwlwifi 0000:09:00.0: FH TRBs(4) = 0x00000000
[249101.377275] iwlwifi 0000:09:00.0: FH TRBs(5) = 0x00000000
[249101.377323] iwlwifi 0000:09:00.0: FH TRBs(6) = 0x00000000
[249101.377363] iwlwifi 0000:09:00.0: FH TRBs(7) = 0x0070409b
[249101.377544] iwlwifi 0000:09:00.0: Q 0 is active and mapped to fifo 3 ra_tid 0x0000 [50,50]
[249101.377638] iwlwifi 0000:09:00.0: Q 1 is active and mapped to fifo 2 ra_tid 0x0000 [180,180]
[249101.377732] iwlwifi 0000:09:00.0: Q 2 is active and mapped to fifo 1 ra_tid 0x0000 [4,19]
[249101.377827] iwlwifi 0000:09:00.0: Q 3 is active and mapped to fifo 0 ra_tid 0x0000 [136,136]
[249101.377993] iwlwifi 0000:09:00.0: Q 4 is active and mapped to fifo 7 ra_tid 0x0000 [156,156]
[249101.378085] iwlwifi 0000:09:00.0: Q 5 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249101.378260] iwlwifi 0000:09:00.0: Q 6 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249101.378456] iwlwifi 0000:09:00.0: Q 7 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249101.378548] iwlwifi 0000:09:00.0: Q 8 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249101.378728] iwlwifi 0000:09:00.0: Q 9 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249101.378820] iwlwifi 0000:09:00.0: Q 10 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249101.379021] iwlwifi 0000:09:00.0: Q 11 is inactive and mapped to fifo 1 ra_tid 0x0000 [245,245]
[249101.379114] iwlwifi 0000:09:00.0: Q 12 is inactive and mapped to fifo 0 ra_tid 0x0002 [10,10]
[249101.379294] iwlwifi 0000:09:00.0: Q 13 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249101.379386] iwlwifi 0000:09:00.0: Q 14 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249101.379567] iwlwifi 0000:09:00.0: Q 15 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249101.379660] iwlwifi 0000:09:00.0: Q 16 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249101.379840] iwlwifi 0000:09:00.0: Q 17 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249101.380017] iwlwifi 0000:09:00.0: Q 18 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249101.380110] iwlwifi 0000:09:00.0: Q 19 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.396020] iwlwifi 0000:09:00.0: fail to flush all tx fifo queues Q 2
[249103.396039] iwlwifi 0000:09:00.0: Current SW read_ptr 25 write_ptr 30
[249103.396096] iwl data: 00000000: 00 00 00 3e 00 00 00 00 00 00 00 00 00 00 00 00  ...>............
[249103.396137] iwlwifi 0000:09:00.0: FH TRBs(0) = 0x80003087
[249103.396193] iwlwifi 0000:09:00.0: FH TRBs(1) = 0x8010201d
[249103.396267] iwlwifi 0000:09:00.0: FH TRBs(2) = 0x802010b3
[249103.396309] iwlwifi 0000:09:00.0: FH TRBs(3) = 0x80300032
[249103.396381] iwlwifi 0000:09:00.0: FH TRBs(4) = 0x00000000
[249103.396421] iwlwifi 0000:09:00.0: FH TRBs(5) = 0x00000000
[249103.396468] iwlwifi 0000:09:00.0: FH TRBs(6) = 0x00000000
[249103.396508] iwlwifi 0000:09:00.0: FH TRBs(7) = 0x007040a3
[249103.396772] iwlwifi 0000:09:00.0: Q 0 is active and mapped to fifo 3 ra_tid 0x0000 [51,51]
[249103.397082] iwlwifi 0000:09:00.0: Q 1 is active and mapped to fifo 2 ra_tid 0x0000 [180,180]
[249103.397261] iwlwifi 0000:09:00.0: Q 2 is active and mapped to fifo 1 ra_tid 0x0000 [25,30]
[249103.397353] iwlwifi 0000:09:00.0: Q 3 is active and mapped to fifo 0 ra_tid 0x0000 [136,136]
[249103.397532] iwlwifi 0000:09:00.0: Q 4 is active and mapped to fifo 7 ra_tid 0x0000 [164,164]
[249103.397625] iwlwifi 0000:09:00.0: Q 5 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.397804] iwlwifi 0000:09:00.0: Q 6 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.397897] iwlwifi 0000:09:00.0: Q 7 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.398047] iwlwifi 0000:09:00.0: Q 8 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.398226] iwlwifi 0000:09:00.0: Q 9 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.398318] iwlwifi 0000:09:00.0: Q 10 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.398498] iwlwifi 0000:09:00.0: Q 11 is inactive and mapped to fifo 1 ra_tid 0x0000 [245,245]
[249103.398591] iwlwifi 0000:09:00.0: Q 12 is inactive and mapped to fifo 0 ra_tid 0x0002 [10,10]
[249103.398770] iwlwifi 0000:09:00.0: Q 13 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.398862] iwlwifi 0000:09:00.0: Q 14 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.399039] iwlwifi 0000:09:00.0: Q 15 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.399219] iwlwifi 0000:09:00.0: Q 16 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.399311] iwlwifi 0000:09:00.0: Q 17 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.399490] iwlwifi 0000:09:00.0: Q 18 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249103.399583] iwlwifi 0000:09:00.0: Q 19 is inactive and mapped to fifo 0 ra_tid 0x0000 [0,0]
[249152.974880] ACPI: \_SB_.PCI0: ACPI_NOTIFY_BUS_CHECK event: unsupported
[249152.974889] ACPI: \_SB_.PCI0: Bus check notify on _handle_hotplug_event_root
[252935.552828] ACPI: \_SB_.PCI0: ACPI_NOTIFY_BUS_CHECK event: unsupported
[252935.552844] ACPI: \_SB_.PCI0: Bus check notify on _handle_hotplug_event_root
[253193.025564] ACPI: \_SB_.PCI0: ACPI_NOTIFY_BUS_CHECK event: unsupported
[253193.025573] ACPI: \_SB_.PCI0: Bus check notify on _handle_hotplug_event_root

По запросу «fail to flush all tx fifo queues» гуглятся багрепорты, в которых советуют отключить wifi n (не вариант совершенно) и прописать «options iwlwifi bt_coex_active=0» в /etc/modprobe.d/iwlwifi.conf (не помогает)

Дистр - арч, ядро 3.11.2-3-ck

Deleted

Последнее исправление: Copycat (всего исправлений: 2)

fail to flush all tx fifo queues

это эпичный фейл интела. сам плакался о нем здесь. окончательного фикса не существует.

прописать «options iwlwifi bt_coex_active=0» в /etc/modprobe.d/iwlwifi.conf (не помогает)

так и есть

отключить wifi n (не вариант совершенно)

а зря. мне оно помогло

ZuBB ★★★★★
()
Последнее исправление: ZuBB (всего исправлений: 1)
Ответ на: комментарий от Deleted

Network controller: Intel Corporation Centrino Advanced-N 6205 [Taylor Peak] (rev 34) @ Thinkpad X230

умвр

anonymous
()

Наблюдения показывают, что зависит от роутера. Мало того, часто роутер переходит в состоянии котлеты, после чего появляется в логах это вот. А если роутер ребутнуть, опять пару-тройку недель бегает как ягуар. С 6205, и с каким то iwl на x200 такая вот фигня

vasily_pupkin ★★★★★
()
7 февраля 2014 г.
Ответ на: комментарий от metawishmaster

TP-Link TL-WDR3600 v1. Проклинаю его на чем свет стоит. Терпимо работает только на транке openwrt. Но хоть iwlwifi не крешится :)

Deleted
()
Ответ на: комментарий от Deleted

%)
то что не крештся - самый главный «+» :), серьезно. только что поменял минорную версию ядра и патчик прокакался по полной программе :(

metawishmaster ★★★★★
()
Последнее исправление: metawishmaster (всего исправлений: 1)
Ответ на: комментарий от Deleted

да, но толь нашел, год назад был похожий патч, но он вызывал дикое снижение скорости...
https://lkml.org/lkml/2013/1/20/4

и я увидел, что у них «next_reclaimed = le16_to_cpu(hdr->seq_ctrl)», а у меня без le16_to_cpu, возможно поэтому у меня все еще падает - фиг знает...

metawishmaster ★★★★★
()
Ответ на: комментарий от metawishmaster

сейчас уже 30 минут гоняется дикий нагрузочный тест сети, скорость сейчас прыгает 175-220Mbps, и раньше валилось как раз на этом тесте

но с тем, что было написано у тех друзей (le16_to_cpu) до сих пор не упало, тьфу-тьфу-тьфу :)

сейчас еще пару часов подожду и, если все будет ок, отредактирую свой пост, на который я присылал Вам ссылку

metawishmaster ★★★★★
()
Ответ на: комментарий от metawishmaster

Вот только сказал.. Час назад крэшнулся iwlwifi.

Завтра попробую собрать ядро с вашим патчем, отпишусь. Что интересно, я думал виновата приделанная к ноуту внешняя антенна, но при переключении на внутреннюю карта совсем сошла с ума и за 10 минут крэшнулась два раза.

09:00.0 Network controller: Intel Corporation Centrino Wireless-N 1000 [Condor Peak]

Deleted
()
Ответ на: комментарий от metawishmaster

Люди говорили появляется не у всех и зависит от передающего устройства

Спасибо, завтра накачу и ближе к вечеру отпишу как и что

Deleted
()
Ответ на: комментарий от metawishmaster

нда... нехорошо удалять из ядра что-ни попадя.
вот только необходимое, у меня в dmesg'e стало чуть меньше каки и пока не падает, хотя предыдущаю версия померла часов через 8, но и каки в dmesg'е было больше
http://pastebin.com/3JaipF7U
спасибо заранее :)

надо будет еще помочь Вам разобраться с N-1000 :)

metawishmaster ★★★★★
()
Последнее исправление: metawishmaster (всего исправлений: 2)
Ответ на: комментарий от metawishmaster

Благодарю! Появилось свободное время, собираю ядро с вашим патчем.

Если бы сразу можно было пробить эту ошибку а не ждать упадет/не упадет..

Deleted
()
Ответ на: комментарий от metawishmaster
:::patch -p0 < iw.patch                          [/tmp/yaourt-tmp-copy/aur-linux-bld/src/linux-3.12]
(Stripping trailing CRs from patch; use --binary to disable.)
patching file drivers/net/wireless/iwlwifi/dvm/tx.c
patch unexpectedly ends in middle of line
Hunk #1 FAILED at 1239.
1 out of 1 hunk FAILED -- saving rejects to file drivers/net/wireless/iwlwifi/dvm/tx.c.rej
Deleted
()
Ответ на: комментарий от Deleted

да соберется... но на собственных тестах не падает фатально только на 3.12.9
к тому же, я только что перешел на 3.13.2 (долго не хотел на 13-ю версию из-за падения производительности дисковой подсистемы)
гоняю тест на ядре без патча, уже несколько часов ничего не падает... только два сообщения «fail to flush all tx fifo queues Q 2» с дампами состояния вылезло...
сейчас подожду пока их будет штук 8, тогда может уже и оборваться линк

а может и нет %)
тогда патч подойдет только для снижения количества «fail to flush all tx fifo queues»

metawishmaster ★★★★★
()
Ответ на: комментарий от metawishmaster

Собрал, тестирую. 3.12.9-1-bld.

На 13-м у меня так же все падало, но с меньшей частотой..

Deleted
()
Ответ на: комментарий от Deleted

Черт. Упало. Полтора часа проработало и пинг резко вырос до 200-250 при прямой видимости точки. Что интересно, в dmesg ни слова

Deleted
()
Ответ на: комментарий от Deleted


А как влияют известные советы типа отключения n и bt_coex_active?


про bt_coex_active ничего сказать не могу, а про 11n_disable - скорость упадет, но работать будет. Но у меня падает только на частоте 5Ггц... но там и скорость может прыгнуть до 230Мбит в секунду, поэтому очень хочется %)

пока что на ванильном 3.13.2 не упало... буду ждать :)


Черт. Упало. Полтора часа проработало и пинг резко вырос до 200-250 при прямой видимости точки. Что интересно, в dmesg ни слова


в dmesg'e ни слова? о.О
может у нас разные причины падений линка?... карточки-таки разные %)
а какая у Вас версия firmware?

metawishmaster ★★★★★
()
Ответ на: комментарий от metawishmaster

Вот и мне хочется n, все-таки карточка не слабая

в dmesg'e ни слова? о.О

У меня такое подозрение что логи сыпятся в другое место. Машинка работает стабильно рандомное количество (обычно не больше 10-и) часов, затем на пустом месте пинг прыгает >200 и скачет в районе 30-2400. Раньше это сопровождалось крэшем iwlwifi и соответствующей простыней в dmesg, сейчас тишина.

а какая у Вас версия firmware?

Подскажите как проверить :)

Deleted
()
Ответ на: комментарий от Deleted

по поводу ошибки, у меня та же фигня... :-\



а какая у Вас версия firmware?


Подскажите как проверить :)


dmesg | grep iwlwifi | grep firmware
или поискать firmware в выводе lshw

metawishmaster ★★★★★
()
Ответ на: комментарий от metawishmaster

Была iwlwifi-1000-5.ucode, спрятал её подальше от модуля, он схватил iwlwifi-1000-3.ucode (loaded firmware version 128.50.3.1 build 13488 op_mode iwldvm). Посмотрим как на ней будет бегать..

Deleted
()
Ответ на: комментарий от Deleted

сейчас ссылку на очень похожую проблему не нашел, но в куче остального написано, что iwlwifi-1000-5.ucode глючная и рекомендуется перейти на iwlwifi-1000-3.ucode. Так что, Вы на верном пути! :)

[upd] ну например http://www.pclinuxos.com/forum/index.php/topic,102327.0/wap2.html

metawishmaster ★★★★★
()
Последнее исправление: metawishmaster (всего исправлений: 1)
Ответ на: комментарий от vasily_pupkin

а у меня роутере нету «HT40+», с цифрой 40 есть только «Channel bandwidth»...

зато я нашел, что у меня «Optimize AMPDU aggregation» был выключен...
ща проверю, как будет со включенным

metawishmaster ★★★★★
()
Ответ на: комментарий от metawishmaster

вобщем фиг знает, но с включеным «Optimize AMPDU aggregation» и моим говнопатчиком получилось передать 1Tb получив в dmesg'e всего один «fail to flush all tx fifo queues», скорости передачи колыхалась до 248Mbps (то что и заметил), средняя вышла 210Mbps, но время пинга поднималось до 500msec. Зато после окончания теста вновь упало до 2ms. И что самое главное, соединение не упало и все еще живет (раньше получалось передать максимум 41Gb).
Сегодня запущу еще один такой тест, но на нетронутом ядре.

metawishmaster ★★★★★
()
Последнее исправление: metawishmaster (всего исправлений: 1)
Ответ на: комментарий от metawishmaster

Какой роутер, какая прошивка? Я знаю атеросы на 40 мгц нестабильно себя ведут..

У меня 19-й час аптайма пошел со стабильным коннектом используя 3-ю версию прошивки. Скорость немного просела разве что (85 -> 65), но это не так критично

Deleted
()
Ответ на: комментарий от metawishmaster

s, но время пинга поднималось до 500msec. Зато после окончания теста вновь упало до 2ms

Абсолютно такая же ситуация случается. Но затишье после прыжков пинга длится не более получаса, затем при любой относительно тяжелой операции начинается та же чепуха

Deleted
()
Ответ на: комментарий от Deleted


Какой роутер, какая прошивка?


ASUS rt-n66u, 3.0.0.4.374_979-gbc8961e
прошивка карточки - 9.221.4.1

сейчас на ванильном ядре (и после включения «Optimize AMPDU aggregation» в роутере) прогнал уже 280Gb всего с тремя сообщениями «fail to flush all tx fifo queues» и еще не отвалился.

metawishmaster ★★★★★
()
Последнее исправление: metawishmaster (всего исправлений: 1)
Ответ на: комментарий от metawishmaster

По слухам от роутера тоже все сильно зависит

У меня рекорд - 30 часов гладкой работы. Крешнулось после насильственного включения работы на 40ГГц. Основательно, вместе с дампом в dmesg

Deleted
()
Ответ на: комментарий от Deleted

я уже осознал паршивость патчика - да, он сокращает удельное количество ошибок, но все-равно сеть валилась до тех пор пока я не включил на роутере «Optimize AMPDU aggregation» - ща все еще работает... и да, зависит от роутера (или его настроек) %)

p.s. но я все время и был на максимально широком канале из тех, что позволял роутер - 40Ггц

metawishmaster ★★★★★
()
Ответ на: комментарий от metawishmaster

У меня после 2х недель безотказной работы на прошивке версии 3 сейчас опять крешнулось. Ну хоть не раз в два часа..

Нового пока ничего по этой проблеме?

Deleted
()
Ответ на: комментарий от Deleted

не-а... все даже хуже: в 3.14 собираются отрубить AMPDU для TX на intelовских карточках-dvm, но и с этим изменением wifi падает :-\

metawishmaster ★★★★★
()
Ответ на: комментарий от Deleted

с таким

sbauer@metabook ~/devel/mkouem$ cat /etc/modprobe.d/iwlwifi.conf
options iwlwifi power_save=0 swcrypto=1 bt_coex_active=0 wd_disable=2



линк хоть и отваливается, но восстанавливается

metawishmaster ★★★★★
()
Последнее исправление: metawishmaster (всего исправлений: 1)
Ответ на: комментарий от metawishmaster

Восстанавливается в плане что сеть «переподнимается»? Печально это все, известный баг но всем пофиг

Deleted
()
Ответ на: комментарий от Deleted

ага, и переподнимается автоматически, раньше нужно было ручками рестартавать сеть...

ну дык штеуд, по-ходу, решил не заниматься «старенькими» карточками... :(

metawishmaster ★★★★★
()
Ответ на: комментарий от metawishmaster

А есть список карт на которых этот баг не появляется?

ну дык штеуд, по-ходу, решил не заниматься «старенькими» карточками... :(

Да, последняя фирмварь чуть ли не 10-го года ЕМНИП

Deleted
()
Ответ на: комментарий от Deleted


А есть список карт на которых этот баг не появляется?


я не видел
что-то мне вспоминается анекдот про неуловимого Джо... :-\

metawishmaster ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.