LINUX.ORG.RU

i915, kswapd0, 100% CPU

 , ,


0

2

После смены бучка случился нежданчик - kswapd0 рандомно начинает выжирать 100% проца по мониторингу. Может через полчаса после бута, может через 5 часов.

Похожие треды - https://lkml.org/lkml/2014/10/28/475 и http://marc.info/?l=linux-mm&m=141433939216636&w=2 но там грабля так и не решилась

Ядро - 3.18.1

Кто-то сталкивался?

Пока отклчил форсирование тайлинга и на всякий XvMC, наблюдаю...

★★★★★

своп отключен, да?

anonymous ()

100500 причин может быть. Логи смотрел? Для начала dmesg.

Reset ★★★★★ ()

Сталкивался,на 12.04 , хрен знает какое там ядро было. Помогало kill виновника торжества,до следующего такого же рандомного глюка, но знающие люди с ЛОРа убедили меня , что все это мне приснилось, матрица и все такое.

ilovewindows ★★★★★ ()
Ответ на: комментарий от Reset

Ничего в логах интересного нет. В дмесже - в момент ора ничего не появилось, при буте ругань на no_hz (типа нестабильный клок, работать не будет) + кучка ругани на ACPI.

NiTr0 ★★★★★ ()

Я столкнулся: 3.17.3, 3.17.7 тоже i915 intel. Почти наверняка начинается при компиляции чего-нибудь, но не обязательно, может и просто ни с того ни с сего. Закономерности так и не уловил.

Пока просто сделал в /etc/crontab

*/5 * * * * root echo 1 > /proc/sys/vm/drop_caches

liaonau ()
Ответ на: комментарий от liaonau

Я чего-то не понимаю...

 ~ # echo 1 > /proc/sys/vm/drop_caches
 ~ # free
             total       used       free     shared    buffers     cached
Mem:       1872584    1261276     611308      66612        928     195632
-/+ buffers/cache:    1064716     807868
Swap:      8388604     157668    8230936
 ~ # echo 3 > /proc/sys/vm/drop_caches
 ~ # free
             total       used       free     shared    buffers     cached
Mem:       1872584    1255376     617208      56936       1804     182016
-/+ buffers/cache:    1071556     801028
Swap:      8388604     157656    8230948
 ~ # free
             total       used       free     shared    buffers     cached
Mem:       1872584    1260648     611936      57172       2544     186172
-/+ buffers/cache:    1071932     800652
Swap:      8388604     157656    8230948
 ~ # echo 3 > /proc/sys/vm/drop_caches
 ~ # free
             total       used       free     shared    buffers     cached
Mem:       1872584    1252224     620360      57124        568     182164
-/+ buffers/cache:    1069492     803092
Swap:      8388604     157656    8230948
Нагрузка ессно 100% осталась.

NiTr0 ★★★★★ ()
Ответ на: комментарий от NiTr0

И не говорю что килялся, 100% нагрузка пропадала. Фик знает с чем связано, появлялась при просмотре фильмов по сети, достаточно бысто минут 5-10.

ilovewindows ★★★★★ ()
Ответ на: комментарий от ilovewindows

В моем случае килл ни с какими сигналами не помогает.

NiTr0 ★★★★★ ()
Ответ на: комментарий от NiTr0

Может быть у нас разные баги?

Сделал так пока, чтобы не сбрасывать кэш без необходимости:

в /etc/crontab

* * * * * root /usr/local/sbin/kswapd.sh

сам скрипт

#!/bin/bash
PID=$(pgrep '^kswapd0$')
[[ -z $PID ]] && exit 0
get_cpu() {
    local CPU=$(top -b -n1 -p ${PID}|tail -n1|sed 's/ \+/ /g'|cut -d ' ' -f 10|sed 's/[,\.].*$//')
    [[ -z $CPU ]] && exit 0
    echo $CPU
}
CPU1=$(get_cpu)
sleep 2
CPU2=$(get_cpu)
if [[ $CPU1 -ge 99 ]] && [[ $CPU2 -ge 99 ]]; then
    logger "detected kswapd0 high CPU utilization. fixing"
    echo 1 > /proc/sys/vm/drop_caches
fi

liaonau ()
Ответ на: комментарий от liaonau

Может и так.

Вообще, i915 как по мне - куда глюкавее радеона :( Тайлинг порой прибивает иксы (с паникой вываливаются), 100% жор cpu....

NiTr0 ★★★★★ ()

Итак, повторился краш иксов:

[46527.716234] general protection fault: 0000 [#1] PREEMPT SMP 
[46527.716314] Modules linked in: cpufreq_ondemand ctr ccm ipv6 uvcvideo videobuf2_vmalloc videobuf2_memops videobuf2_core v4l2_common btusb videodev bluetooth ath9k ath9k_common ath9k_hw tg3 snd_hda_codec_hdmi snd_hda_codec_realtek mac80211 snd_hda_codec_generic acer_wmi iTCO_wdt sparse_keymap i915 ptp snd_hda_intel pps_core ath libphy snd_hda_controller cfg80211 pcspkr hwmon sdhci_pci sdhci snd_hda_codec mmc_core cfbfillrect ehci_pci snd_hwdep ehci_hcd snd_pcm wmi battery cfbimgblt snd_timer snd cfbcopyarea usbcore drm_kms_helper lpc_ich intel_gtt usb_common mfd_core ac acpi_cpufreq soundcore processor
[46527.716993] CPU: 0 PID: 2235 Comm: X Tainted: G        W      3.18.1-gentoo #1
[46527.717061] Hardware name: Acer V5-131/Mimic             , BIOS V2.21 11/26/2013
[46527.717130] task: ffff880075cba540 ti: ffff880076ba8000 task.ti: ffff880076ba8000
[46527.717199] RIP: 0010:[<ffffffffa0240461>]  [<ffffffffa0240461>] i915_gem_set_tiling+0x251/0x510 [i915]
[46527.717322] RSP: 0018:ffff880076babd88  EFLAGS: 00010206
[46527.717372] RAX: ffff88002cb4a600 RBX: ffff88002cb4a540 RCX: dead000000100098
[46527.717437] RDX: dead000000100100 RSI: 0000000000000000 RDI: 00000000ffffffff
[46527.717502] RBP: ffff880076babda8 R08: 0000000000004000 R09: 0000000000000000
[46527.717566] R10: ffffffffa02c3ac0 R11: ffff880076babdf8 R12: ffff8800668a0000
[46527.717632] R13: ffff880076babdf8 R14: ffff880067731800 R15: ffff880076344200
[46527.717698] FS:  00007fd696f258c0(0000) GS:ffff880100200000(0000) knlGS:0000000000000000
[46527.717772] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
[46527.717824] CR2: 00007fd68f3bb000 CR3: 00000000688b2000 CR4: 00000000001406b0
[46527.717888] Stack:
[46527.717910]  fffffffffffffff2 ffff880076babdf8 0000000000000061 ffff880067731800
[46527.717991]  ffff880076babea8 ffffffff813c31bc ffff880076babdc8 ffff880076babdf8
[46527.718070]  ffff880076babdf8 ffffffffa02c3ac0 00007fffd0b0aa90 ffff880100000010
[46527.718150] Call Trace:
[46527.718182]  [<ffffffff813c31bc>] drm_ioctl+0x1ac/0x630
[46527.718239]  [<ffffffff8129e49b>] ? avc_has_perm+0xdb/0x1a0
[46527.718296]  [<ffffffff81078b9d>] ? sched_clock_local+0x1d/0x90
[46527.718356]  [<ffffffff81193be0>] do_vfs_ioctl+0x2d0/0x4b0
[46527.718410]  [<ffffffff812a0a0f>] ? file_has_perm+0x8f/0xa0
[46527.718466]  [<ffffffff81316983>] ? __this_cpu_preempt_check+0x13/0x20
[46527.718528]  [<ffffffff81193e49>] SyS_ioctl+0x89/0xa0
[46527.718577]  [<ffffffff81193dc1>] ? SyS_ioctl+0x1/0xa0
[46527.718629]  [<ffffffff8157a2d6>] system_call_fastpath+0x16/0x1b
[46527.718685] Code: 4c 89 f7 e8 e2 7b 33 e1 44 89 e0 5b 41 5c 41 5d 41 5e 5d c3 66 0f 1f 44 00 00 48 8b 51 68 48 39 d0 48 8d 4a 98 0f 84 a7 fe ff ff <f6> 42 40 0f 74 e9 8b 13 83 fa 01 0f 84 75 02 00 00 8d 4a ff 89 
[46527.719065] RIP  [<ffffffffa0240461>] i915_gem_set_tiling+0x251/0x510 [i915]
[46527.719157]  RSP <ffff880076babd88>
[46527.726376] ---[ end trace 833aa6839af8613d ]---

После рестарта иксов - kswapd0 продолжает жрать.

NiTr0 ★★★★★ ()
Ответ на: комментарий от NiTr0

посмотри хоть через perf top в чём он крутится. и, да детка, здесь не багзилла ядра. английского уровня полутора классов школы достаточно, проверено

anonymous ()
Ответ на: комментарий от anonymous

Да какбы крутится на том же на чем и должен, судя по подобным случаям:

     9.43%  [kernel]                 [k] _raw_spin_lock               
            |
            --- _raw_spin_lock
               |          
               |--110.17%-- list_lru_count_node
               |          super_cache_count
               |          shrink_slab_node
               |          shrink_slab
               |          kswapd_shrink_zone
               |          kswapd
               |          kthread
               |          ret_from_fork
               |          
               |--2.35%-- super_cache_count
               |          shrink_slab_node
               |          shrink_slab
               |          kswapd_shrink_zone
               |          kswapd
               |          kthread
               |          ret_from_fork
               |          
               |--1.76%-- mb_cache_shrink_count
               |          shrink_slab_node
               |          shrink_slab
               |          kswapd_shrink_zone
               |          kswapd
               |          kthread
               |          ret_from_fork
                --14464489349623.20%-- [...]

     7.21%  [i915]                   [k] i915_gem_shrinker_count      
            |
            --- i915_gem_shrinker_count
                shrink_slab_node
                shrink_slab
                kswapd_shrink_zone
                kswapd
                kthread
                ret_from_fork

     5.98%  [kernel]                 [k] shrink_slab_node             
            |
            --- shrink_slab_node
               |          
               |--105.95%-- shrink_slab
               |          kswapd_shrink_zone
               |          kswapd
               |          kthread
               |          ret_from_fork
               |          
               |--8.34%-- kswapd_shrink_zone
               |          kswapd
               |          kthread
               |          ret_from_fork
                --22791344029279.37%-- [...]

     5.81%  [kernel]                 [k] _raw_spin_unlock             
            |
            --- _raw_spin_unlock
               |          
               |--96.14%-- list_lru_count_node
               |          super_cache_count
               |          shrink_slab_node
               |          shrink_slab
               |          kswapd_shrink_zone
               |          kswapd
               |          kthread
               |          ret_from_fork
               |          
               |--18.15%-- super_cache_count
               |          shrink_slab_node
               |          shrink_slab
               |          kswapd_shrink_zone
               |          kswapd
               |          kthread
               |          ret_from_fork
                --23489686046890.04%-- [...]

     3.33%  [kernel]                 [k] super_cache_count            
            |
            --- super_cache_count
               |          
               |--63.25%-- shrink_slab_node
               |          shrink_slab
               |          kswapd_shrink_zone
               |          kswapd
               |          kthread
               |          ret_from_fork
               |          
               |--51.04%-- shrink_slab
               |          kswapd_shrink_zone
               |          kswapd
               |          kthread
               |          ret_from_fork
                --40935909178814.12%-- [...]

Другое дело, что у людей это было на более старых ядрышках, и был волшебный патч который должен был поправить подобные глюки...

А багрепорт какбы уже отправил, для начала - дистропейсателям. Вопрос стоял в том, были ли еще подобные глюки у счастливых обладателей «самой linux-friendly видяхи», или это мне так повезло с корявой железкой.

NiTr0 ★★★★★ ()

Поигрался с опциями ядра - нагрузка теперь падает при чистке кешей.

Скорее всего грабля решится добавкой памяти, но все равно - неприятно.

NiTr0 ★★★★★ ()
Последнее исправление: NiTr0 (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.