LINUX.ORG.RU

[gentoo][kernel]Фриз системы с трейсом в tty

 ,


0

2

Есть у меня многострадальный ноутбук HP Pavilion dv6-3125er, с которым прилично намучался. Периодически при запуске/завершении работы некоторых приложений вылетает из иксов в tty и выводит сообщение примерно следующего содержания:

Jan 16 16:19:55 laptop kernel: BUG: unable to handle kernel paging request at 0000007a00000010
Jan 16 16:19:55 laptop kernel: IP: [<ffffffff8187b1a8>] __mutex_unlock_slowpath+0x20/0x2e
Jan 16 16:19:55 laptop kernel: PGD 157fe3067 PUD 0 
Jan 16 16:19:55 laptop kernel: Oops: 0000 [#1] SMP 
Jan 16 16:19:55 laptop kernel: last sysfs file: /sys/devices/virtual/wmi/D0992BD4-A47C-4EFE-B072-324AEC92296C/uevent
Jan 16 16:19:55 laptop kernel: CPU 0 
Jan 16 16:19:55 laptop kernel: Modules linked in: i915
Jan 16 16:19:55 laptop kernel: 
Jan 16 16:19:55 laptop kernel: Pid: 10170, comm: glxgears Not tainted 2.6.37 #1 144A/HP Pavilion dv6 Notebook PC
Jan 16 16:19:55 laptop kernel: RIP: 0010:[<ffffffff8187b1a8>]  [<ffffffff8187b1a8>] __mutex_unlock_slowpath+0x20/0x2e
Jan 16 16:19:55 laptop kernel: RSP: 0018:ffff880155d81d00  EFLAGS: 00010217
Jan 16 16:19:55 laptop kernel: RAX: 0000007a00000000 RBX: ffff8801566ffa20 RCX: 0000000000000000
Jan 16 16:19:55 laptop kernel: RDX: ffff8801566ffa28 RSI: ffff880155d81d88 RDI: ffff8801566ffa24
Jan 16 16:19:55 laptop kernel: RBP: 0000000000000000 R08: 0000000000000000 R09: 000000000000165d
Jan 16 16:19:55 laptop kernel: R10: 0000000000010002 R11: 0000000000000001 R12: ffff880155d81d28
Jan 16 16:19:55 laptop kernel: R13: ffff8801566fe000 R14: ffffffff81ea8b60 R15: 00000000c0206466
Jan 16 16:19:55 laptop kernel: FS:  00007f26e56d2700(0000) GS:ffff88009b400000(0000) knlGS:0000000000000000
Jan 16 16:19:55 laptop kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan 16 16:19:55 laptop kernel: CR2: 0000007a00000010 CR3: 0000000155f7b000 CR4: 00000000000006f0
Jan 16 16:19:55 laptop kernel: DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
Jan 16 16:19:55 laptop kernel: DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
Jan 16 16:19:55 laptop kernel: Process glxgears (pid: 10170, threadinfo ffff880155d80000, task ffff8801575908e0)
Jan 16 16:19:55 laptop kernel: Stack:
Jan 16 16:19:55 laptop kernel: ffff8801566ffa20 ffffffff8187b187 ffffffff8135e385 ffff88015495bc48
Jan 16 16:19:55 laptop kernel: ffff880155d81e18 ffff880157f33888 ffff8801566fe000 ffff880152bf0140
Jan 16 16:19:55 laptop kernel: 0000000000000002 ffff880155fef540 ffff88015638dd80 000000090000165d
Jan 16 16:19:55 laptop kernel: Call Trace:
Jan 16 16:19:55 laptop kernel: [<ffffffff8187b187>] ? mutex_unlock+0x12/0x13
Jan 16 16:19:55 laptop kernel: [<ffffffff8135e385>] ? radeon_cs_ioctl+0x17d/0x18d
Jan 16 16:19:55 laptop kernel: [<ffffffff8130d41b>] ? drm_ioctl+0x251/0x306
Jan 16 16:19:55 laptop kernel: [<ffffffff8135e208>] ? radeon_cs_ioctl+0x0/0x18d
Jan 16 16:19:55 laptop kernel: [<ffffffff81026497>] ? do_page_fault+0x31b/0x358
Jan 16 16:19:55 laptop kernel: [<ffffffff8108b002>] ? mmap_region+0x336/0x43f
Jan 16 16:19:55 laptop kernel: [<ffffffff810a5b05>] ? do_vfs_ioctl+0x450/0x48f
Jan 16 16:19:55 laptop kernel: [<ffffffff810a5b80>] ? sys_ioctl+0x3c/0x60
Jan 16 16:19:55 laptop kernel: [<ffffffff81008712>] ? system_call_fastpath+0x16/0x1b
Jan 16 16:19:55 laptop kernel: Code: f0 ff 07 7f 05 e8 01 00 00 00 c3 53 48 89 fb 48 8d 7f 04 e8 ac 0f 00 00 48 8b 43 08 48 8d 53 08 c7 03 01 00 00 00 48 39 d0 74 09 <48> 8b 78 10 e8 bd 6f 7b ff fe 43 04 5b c3 b8 01 00 00 00 31 d2 
Jan 16 16:19:55 laptop kernel: RIP  [<ffffffff8187b1a8>] __mutex_unlock_slowpath+0x20/0x2e
Jan 16 16:19:55 laptop kernel: RSP <ffff880155d81d00>
Jan 16 16:19:55 laptop kernel: CR2: 0000007a00000010
Jan 16 16:19:55 laptop kernel: ---[ end trace e285983204c9bac3 ]---

Сразу скажу - информация в строках

laptop kernel: last sysfs file: /sys/devices/virtual/wmi/D0992BD4-A47C-4EFE-B072-324AEC92296C/uevent
laptop kernel: CPU 0
laptop kernel: Modules linked in: i915
laptop kernel: Pid: 10170, comm: glxgears Not tainted 2.6.37 #1 144A/HP Pavilion dv6 Notebook PC
при каждом вылете изменяется. Ну, учитывая контекст самого сообщения, понятно, что и в других строках меняются как минимум адреса, это скорее для внесения некоторой ясности. На данный момент ядро собрано при помощи genkernel - вот конфиг на pastebin.

//К примеру, в последний раз вылет происходил при завершении работы glxgears и при попытке запуска гномовского networkmanager'овского гуевого апплета (nm-applet).

В зависимости от конфигурации ядра модули, на которые ядро ссылается в сообщениях, могут варьироваться. Т.е. проблема явно не к кривизне модулей, да и ядро не какой-нибудь сырющей версии.

Память проверял несколько раз - ни единого намека на битые сектора.

Собственно, сабж.

★★★★
Ответ на: комментарий от post-factum

Аналогично. Да, забыл отписать, пробовал ядра из разных сырцов, включая vanilla, начиная с версии 2.6.35.

Insomnium ★★★★
() автор топика

Раз ядро not tainted, то вам в багзиллу ядра. И еще хорошо бы насобирать побольше таких логов.

Relan ★★★★★
()
Jan 16 16:19:55 laptop kernel: [<ffffffff8135e385>] ? radeon_cs_ioctl+0x17d/0x18d
Jan 16 16:19:55 laptop kernel: [<ffffffff8130d41b>] ? drm_ioctl+0x251/0x306
Jan 16 16:19:55 laptop kernel: [<ffffffff8135e208>] ? radeon_cs_ioctl+0x0/0x18d
Jan 16 16:19:55 laptop kernel: [<ffffffff81026497>] ? do_page_fault+0x31b/0x358
Jan 16 16:19:55 laptop kernel: [<ffffffff8108b002>] ? mmap_region+0x336/0x43f
Jan 16 16:19:55 laptop kernel: [<ffffffff810a5b05>] ? do_vfs_ioctl+0x450/0x48f

Эти строки всегда есть?

anonymous
()
Ответ на: комментарий от AptGet

Сейчас не могу сказать со стопроцентной точностью, но mutex_unlock и sys_ioctl там точно фигурируют. Да, это вы хорошо подметили, сегодня не смогу ничего сказать - ноутбука нет под рукой, но сдается мне, что радеон там тоже мелькает. И вот он hint: ноут с дискретной карточкой Radeon HD 5650, вокруг которого приходилось прыгать с бубном, отписываясь в эти треды: раз, два. Завтра попробую то же самое, отключив в vga switcheroo карточку radeon и выгрузив лишние модули. И тем не менее, не очень-то похоже на правду. Иначе как объяснить проблемы с запуском таких приложений, как nm-applet... Тут уж точно никакими иксами не пахнет.

Insomnium ★★★★
() автор топика
Ответ на: комментарий от anonymous

Нет, никак. Фирмварь нужна для открытых драйверов и определения карточки, а DRM необходим для vga switcheroo.

Insomnium ★★★★
() автор топика
Ответ на: комментарий от Insomnium

И да, карточка, мать её, дискретная.

Insomnium ★★★★
() автор топика

Вот это вот

laptop kernel: last sysfs file: /sys/devices/virtual/wmi/D0992BD4-A47C-4EFE-B072-324AEC92296C/uevent

А именно wmi наталкивает на acpi а оно в свою очередь на dsdt и конечно же wmi

Так вот к чему я… dsdt исправлял? Если нет то тебе туда

HOWTO: Fix Common ACPI Problems (DSDT, ECDT, etc.)

ACPI/Fix common problems

Ага так вот кроме прочих «подарков» в виде ошибок в dsdt при «исправлении» dsdt этот <вырезано цензурой> wmi можно вообще отключить к хренам собачьим.

init_6 ★★★★★
()

Да а кроме того… во первых не стоит юзать суперсвежие ядра. Учись хотя бы у той же красношапки. Угадай почему они пока что на *.32-м сидят ;) пруф Так чиста от нефиг делать? Да и во вторых раз уж нашел багу то пинай ядреную багзиллу.

init_6 ★★★★★
()

…и еще один момент. Твой конфиг проверять лениво. Если включал CONFIG_HP_WMI модулем попробуй заблеклистить. Если вкомпиливал в ядро собери модулем. Затем чтобы проверить работу с загруженным hp-wmi и без него вообще. Зачем? А оно просто тоже загадочное… Мне например нужно CONFIG_ACER_WMI так когда acer-wmi загружен то встроенного картридера нет.

init_6 ★★★★★
()
Ответ на: комментарий от init_6

Да, я понимаю, что стремление к стабильности не без причин зародилось. :} Ну а по поводу твоего предположения - дело скорее всего не в этом. Ибо я уже писал, что эта строка с каждой ошибкой меняется. Скорее всего просто последний файл, к которому на момент вылета производилось обращение. Так что делать выводы на основании этого сообщений сложно. :C

Insomnium ★★★★
() автор топика
Ответ на: комментарий от Insomnium

Далкео за примером ходить не надо:

Jan  8 20:45:34 laptop kernel: start_kdeinit (18203): /proc/18203/oom_adj is deprecated, please use /proc/18203/oom_score_adj instead.
Jan  8 20:45:40 laptop kernel: BUG: unable to handle kernel paging request at 0000007a00000010
Jan  8 20:45:40 laptop kernel: IP: [<ffffffff8184889b>] __mutex_unlock_slowpath+0x20/0x2e
Jan  8 20:45:40 laptop kernel: PGD 1526e0067 PUD 0 
Jan  8 20:45:40 laptop kernel: Oops: 0000 [#1] SMP 
Jan  8 20:45:40 laptop kernel: last sysfs file: /sys/devices/virtual/backlight/acpi_video1/actual_brightness
Jan  8 20:45:40 laptop kernel: CPU 1 
Jan  8 20:45:40 laptop kernel: Modules linked in: i915
Jan  8 20:45:40 laptop kernel: 
Jan  8 20:45:40 laptop kernel: Pid: 18159, comm: X Not tainted 2.6.36-gentoo-r5 #9 144A/HP Pavilion dv6 Notebook PC
Jan  8 20:45:40 laptop kernel: RIP: 0010:[<ffffffff8184889b>]  [<ffffffff8184889b>] __mutex_unlock_slowpath+0x20/0x2e
Jan  8 20:45:40 laptop kernel: RSP: 0018:ffff880153e35d00  EFLAGS: 00010203
Jan  8 20:45:40 laptop kernel: RAX: 0000007a00000000 RBX: ffff88015660bc28 RCX: 0000000000000000
Jan  8 20:45:40 laptop kernel: RDX: ffff88015660bc30 RSI: ffff880153e35d88 RDI: ffff88015660bc2c
Jan  8 20:45:40 laptop kernel: RBP: 0000000000000000 R08: 0000000000000000 R09: 00000000000003ef
Jan  8 20:45:40 laptop kernel: R10: 0000000000040004 R11: 0000000000000002 R12: ffff880153e35d28
Jan  8 20:45:40 laptop kernel: R13: ffff88015660a000 R14: ffffffff81f2ce30 R15: 00000000c0206466
Jan  8 20:45:40 laptop kernel: FS:  00007f898ca60700(0000) GS:ffff880002440000(0000) knlGS:0000000000000000
Jan  8 20:45:40 laptop kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Jan  8 20:45:40 laptop kernel: CR2: 0000007a00000010 CR3: 00000001525f7000 CR4: 00000000000006e0
Jan  8 20:45:40 laptop kernel: DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
Jan  8 20:45:40 laptop kernel: DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
Jan  8 20:45:40 laptop kernel: Process X (pid: 18159, threadinfo ffff880153e34000, task ffff880157580870)
Jan  8 20:45:40 laptop kernel: Stack:
Jan  8 20:45:40 laptop kernel: ffff88015660bc28 ffffffff8184887a ffffffff8133d859 0000000000000296
Jan  8 20:45:40 laptop kernel: <0> ffff880153e35e18 ffff880157e80088 ffff88015660a000 ffff880155d19680
Jan  8 20:45:40 laptop kernel: <0> 0000000000000002 ffff880153cfaac0 ffff88015362db80 00000007000003ef
Jan  8 20:45:40 laptop kernel: Call Trace:
Jan  8 20:45:40 laptop kernel: [<ffffffff8184887a>] ? mutex_unlock+0x12/0x13
Jan  8 20:45:40 laptop kernel: [<ffffffff8133d859>] ? radeon_cs_ioctl+0x17d/0x18d
Jan  8 20:45:40 laptop kernel: [<ffffffff8133bfb0>] ? radeon_gem_wait_idle_ioctl+0xd0/0xde
Jan  8 20:45:40 laptop kernel: [<ffffffff812ed8ef>] ? drm_ioctl+0x251/0x306
Jan  8 20:45:40 laptop kernel: [<ffffffff8133d6dc>] ? radeon_cs_ioctl+0x0/0x18d
Jan  8 20:45:40 laptop kernel: [<ffffffff81006d20>] ? __switch_to+0x248/0x26f
Jan  8 20:45:40 laptop kernel: [<ffffffff8104d833>] ? enqueue_hrtimer+0x61/0x6f
Jan  8 20:45:40 laptop kernel: [<ffffffff8109d879>] ? do_vfs_ioctl+0x450/0x48f
Jan  8 20:45:40 laptop kernel: [<ffffffff81848262>] ? schedule+0x572/0x619
Jan  8 20:45:40 laptop kernel: [<ffffffff8109d8f4>] ? sys_ioctl+0x3c/0x60
Jan  8 20:45:40 laptop kernel: [<ffffffff81007f02>] ? system_call_fastpath+0x16/0x1b
Jan  8 20:45:40 laptop kernel: Code: f0 ff 07 7f 05 e8 01 00 00 00 c3 53 48 89 fb 48 8d 7f 04 e8 b1 0f 00 00 48 8b 43 08 48 8d 53 08 c7 03 01 00 00 00 48 39 d0 74 09 <48> 8b 78 10 e8 8b 88 7e ff fe 43 04 5b c3 b8 01 00 00 00 31 d2 
Jan  8 20:45:40 laptop kernel: RIP  [<ffffffff8184889b>] __mutex_unlock_slowpath+0x20/0x2e
Jan  8 20:45:40 laptop kernel: RSP <ffff880153e35d00>
Jan  8 20:45:40 laptop kernel: CR2: 0000007a00000010
Jan  8 20:45:40 laptop kernel: ---[ end trace 69799fd684671e2c ]---

И да, i915 тут тоже ни при чем - проверял...

Insomnium ★★★★
() автор топика
Ответ на: комментарий от Insomnium

А это у тебя опять вовсе не acpi всплыло:

Jan 8 20:45:40 laptop kernel: last sysfs file: /sys/devices/virtual/backlight/acpi_video1/actual_brightness

init_6 ★★★★★
()
Ответ на: комментарий от init_6

За наводку в любом случае спасибо. Сейчас ноутбука под рукой нет, но завтра первым делом проверю.

Insomnium ★★★★
() автор топика
Ответ на: комментарий от init_6

Вот то-то и оно. Уже не знаю на что и подумать. На ровном месте падает. Раньше дел с ноутбуками не имел, самое необычное, с чем пришлось иметь дело в этот раз - переключение между интегрированной и дискретной карточками. Вот тут два треда: раз и два. Может, открытые драйвера / ядерный KMS/DRM / сборка ядра с фирмарью дают какой-то негативный сверхъестественный эффект...

Insomnium ★★★★
() автор топика
Ответ на: комментарий от Insomnium

acpi у тебя всплывает при каждом Ooooopse а в acpi первое за что нужно хвататься это dsdt. Правильно исправленный dsdt ничего и нигде не ухудшит. Только проблем поменьше станет. После acpi/dsdt потести и {с}/{без} модуля hp-wmi Так на всякий случай.

init_6 ★★★★★
()
Ответ на: комментарий от Insomnium

Ага и в любом случае собранные трейсы по твоим Oops-ам забагзилль в ядреную багзиллу… В любом случае не сразу так когда то же пофиксят.

init_6 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.