LINUX.ORG.RU

Полное зависание системы [gentoo-sources-3.2.11]


0

1

С недавних пор (после обновления до ядра 3.2.11) пару раз получал конкретные зависания. Намертво - на мышку/клаву не реагирует, на sysrq-сочетания тоже. Лечится только ресетом.

Сегодня приобрело более острую форму тем, что даже после перезагрузки всё равно висло...

На более старых ядрах работало нормально, но пока на 100% не уверен, что виновато ядро. Попробую откатиться.

Прежде чем писать bug report (если в этом вообще есть смысл), решил отписать сюда.

Покопался в /var/log/messages, нашёл

Mar 18 21:16:03 localhost kernel: [   30.856048] BUG: unable to handle kernel paging request at 0000749c
Mar 18 21:16:03 localhost kernel: [   30.856077] IP: [<c105b88d>] process_one_work+0x1f7/0x23f
Mar 18 21:16:03 localhost kernel: [   30.856105] *pdpt = 0000000031f1a001 *pde = 0000000000000000 
Mar 18 21:16:03 localhost kernel: [   30.856125] Oops: 0000 [#1] SMP 
Mar 18 21:16:03 localhost kernel: [   30.856141] Modules linked in: nvidia(P)
Mar 18 21:16:03 localhost kernel: [   30.856157] 
Mar 18 21:16:03 localhost kernel: [   30.856172] Pid: 10, comm: kworker/0:1 Tainted: P           O 3.2.11-gentoo #1 System manufacturer System Product Name/M4A77TD
Mar 18 21:16:03 localhost kernel: [   30.856198] EIP: 0060:[<c105b88d>] EFLAGS: 00010046 CPU: 0
Mar 18 21:16:03 localhost kernel: [   30.856216] EIP is at process_one_work+0x1f7/0x23f
Mar 18 21:16:03 localhost kernel: [   30.856233] EAX: 0000f9f9 EBX: c16df520 ECX: f2e02d00 EDX: 000000f9
Mar 18 21:16:03 localhost kernel: [   30.856250] ESI: 00007498 EDI: f2e02d00 EBP: 00000000 ESP: f288bf74
Mar 18 21:16:03 localhost kernel: [   30.856267]  DS: 007b ES: 007b FS: 00d8 GS: 0000 SS: 0068
Mar 18 21:16:03 localhost kernel: [   30.856285] Process kworker/0:1 (pid: 10, ti=f288a000 task=f286ca50 task.ti=f288a000)
Mar 18 21:16:03 localhost kernel: [   30.856301] Stack:
Mar 18 21:16:03 localhost kernel: [   30.856312]  f2e06a00 c1439636 00e02d00 f2e06a05 f2853a40 f2e02d00 f2e02d00 f2853a50
Mar 18 21:16:03 localhost kernel: [   30.856337]  c105cf83 f286ca50 00000009 f2e02d04 f286ca50 f286ca50 f286ca50 f287df20
Mar 18 21:16:03 localhost kernel: [   30.856362]  f2853a40 c105ce41 00000000 c105f691 00000000 f2853a40 00000000 00000000
Mar 18 21:16:03 localhost kernel: [   30.856386] Call Trace:
Mar 18 21:16:03 localhost kernel: [   30.856406]  [<c1439636>] ? sunrpc_cache_register_pipefs+0xe6/0xe6
Mar 18 21:16:03 localhost kernel: [   30.856426]  [<c105cf83>] ? worker_thread+0x142/0x1f1
Mar 18 21:16:03 localhost kernel: [   30.856445]  [<c105ce41>] ? manage_workers.clone.18+0x142/0x142
Mar 18 21:16:03 localhost kernel: [   30.856465]  [<c105f691>] ? kthread+0x63/0x68
Mar 18 21:16:03 localhost kernel: [   30.856484]  [<c105f62e>] ? kthread_worker_fn+0x113/0x113
Mar 18 21:16:03 localhost kernel: [   30.856504]  [<c1455836>] ? kernel_thread_helper+0x6/0xd
Mar 18 21:16:03 localhost kernel: [   30.856519] Code: ff ff c6 05 80 f0 6a c1 01 8b 46 24 89 c2 83 e2 bf 81 e7 f8 00 00 00 89 56 24 74 0f a8 b8 75 0b 8b 43 0c e8 7f f6 ff ff f0 ff 00 <8b> 56 04 85 d2 74 18 8b 06 85 c0 89 02 74 03 89 50 04 c7 06 00 
Mar 18 21:16:03 localhost kernel: [   30.856623] EIP: [<c105b88d>] process_one_work+0x1f7/0x23f SS:ESP 0068:f288bf74
Mar 18 21:16:03 localhost kernel: [   30.856645] CR2: 000000000000749c
Mar 18 21:16:03 localhost kernel: [   30.856660] ---[ end trace 38c4438f0e350813 ]---
Mar 18 21:16:03 localhost kernel: [   30.856716] BUG: unable to handle kernel paging request at fffffffc
Mar 18 21:16:03 localhost kernel: [   30.856735] IP: [<c105f7e7>] kthread_data+0x6/0xa
Mar 18 21:16:03 localhost kernel: [   30.856756] *pdpt = 0000000001698001 *pde = 000000000169c067 *pte = 0000000000000000 
Mar 18 21:16:03 localhost kernel: [   30.856776] Oops: 0000 [#2] SMP 
Mar 18 21:16:03 localhost kernel: [   30.856790] Modules linked in: nvidia(P)
Mar 18 21:16:03 localhost kernel: [   30.856806] 
Mar 18 21:16:03 localhost kernel: [   30.856819] Pid: 10, comm: kworker/0:1 Tainted: P      D    O 3.2.11-gentoo #1 System manufacturer System Product Name/M4A77TD
Mar 18 21:16:03 localhost kernel: [   30.856844] EIP: 0060:[<c105f7e7>] EFLAGS: 00010002 CPU: 0
Mar 18 21:16:03 localhost kernel: [   30.856862] EIP is at kthread_data+0x6/0xa
Mar 18 21:16:03 localhost kernel: [   30.856878] EAX: 00000000 EBX: f286ccc4 ECX: 31775000 EDX: 00000000
Mar 18 21:16:03 localhost kernel: [   30.856895] ESI: 00000000 EDI: f286ca50 EBP: f286ca50 ESP: f288bdb8
Mar 18 21:16:03 localhost kernel: [   30.856912]  DS: 007b ES: 007b FS: 00d8 GS: 0000 SS: 0068
Mar 18 21:16:03 localhost kernel: [   30.856928] Process kworker/0:1 (pid: 10, ti=f288a000 task=f286ca50 task.ti=f288a000)
Mar 18 21:16:03 localhost kernel: [   30.856945] Stack:
Mar 18 21:16:03 localhost kernel: [   30.856957]  c105d056 f286ccc4 f2e05ec0 f286ca50 c1452dac c11f75c1 00000003 00000000
Mar 18 21:16:03 localhost kernel: [   30.856982]  f286ccc4 00000000 c1690ec0 f26dbab8 00000001 c1690ec0 c1690ec0 f286ca50
Mar 18 21:16:03 localhost kernel: [   30.857007]  c1690ec0 00000000 f236f000 00000046 f186bec8 f236f000 f1c50bd8 f186bec8
Mar 18 21:16:03 localhost kernel: [   30.857017] Call Trace:
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c105d056>] ? wq_worker_sleeping+0xa/0x5c
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c1452dac>] ? __schedule+0x117/0x736
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c11f75c1>] ? radix_tree_delete+0x169/0x17b
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c11f07c7>] ? cic_free_func+0x4f/0x63
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c11f0778>] ? cfq_should_idle+0x84/0x84
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c104f5d4>] ? do_exit+0x5fa/0x5fc
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c10272bc>] ? oops_end+0x78/0x7b
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c103ae72>] ? no_context+0x13d/0x147
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c103b306>] ? vmalloc_sync_all+0x1c9/0x1c9
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c103af8b>] ? bad_area_nosemaphore+0xa/0xc
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c103b463>] ? do_page_fault+0x15d/0x342
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c1453354>] ? __schedule+0x6bf/0x736
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c105ccb2>] ? queue_delayed_work_on+0x9a/0xb1
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c103b306>] ? vmalloc_sync_all+0x1c9/0x1c9
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c14550b6>] ? error_code+0x5a/0x60
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c103b306>] ? vmalloc_sync_all+0x1c9/0x1c9
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c105b88d>] ? process_one_work+0x1f7/0x23f
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c1439636>] ? sunrpc_cache_register_pipefs+0xe6/0xe6
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c105cf83>] ? worker_thread+0x142/0x1f1
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c105ce41>] ? manage_workers.clone.18+0x142/0x142
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c105f691>] ? kthread+0x63/0x68
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c105f62e>] ? kthread_worker_fn+0x113/0x113
Mar 18 21:16:03 localhost kernel: [   30.857017]  [<c1455836>] ? kernel_thread_helper+0x6/0xd
Mar 18 21:16:03 localhost kernel: [   30.857017] Code: 24 10 b9 88 02 46 c1 31 d2 e8 5e 97 fe ff 8b 44 24 10 ba 00 dd 45 c1 e8 93 9e fe ff 5a 8b 44 24 0c 83 c4 28 c3 8b 80 48 02 00 00 <8b> 40 fc c3 31 c0 c3 55 ba 1c 69 54 c1 57 64 8b 3d 5c c6 68 c1 
Mar 18 21:16:03 localhost kernel: [   30.857017] EIP: [<c105f7e7>] kthread_data+0x6/0xa SS:ESP 0068:f288bdb8
Mar 18 21:16:03 localhost kernel: [   30.857017] CR2: 00000000fffffffc
Mar 18 21:16:03 localhost kernel: [   30.857017] ---[ end trace 38c4438f0e350814 ]---
Mar 18 21:16:03 localhost kernel: [   30.857017] Fixing recursive fault but reboot is needed!

не уверен пока. что именно к этому имеет отношение - но показалось подозрительным.

Что скажете, знатоки ядра? :) или вовсе и не ядро виновато?..

А может видяхе трындец приходит? Тут каким-то боком всплывает слово nvidia... Но версию драйвера я давно уж не обновлял (295.20-r1)

BattleCoder ★★★★★ ()
Ответ на: комментарий от tazhate

А почему сразу pf-sources? :)

Кстати, что странно... я всю жизнь думал, что вероятность подхватить баг в версии с большой третьей цифрой минимальный... ведь в минорщине обычно ошибки исправляют, стараясь новых не добавлять...

Вот и думаю, на какое лучше откатиться. на 3.2.9 или сразу на 3.1?

наверное откачусь на стабильную ветку, то есть на 3.2.1-r2

BattleCoder ★★★★★ ()
Ответ на: комментарий от BattleCoder

наверное откачусь на стабильную ветку, то есть на 3.2.1-r2

Да, наверное лучше так.

А почему сразу pf-sources? :)

Потому что сам пользуюсь и нравится :)

tazhate ★★★★★ ()
Ответ на: комментарий от init_6

Вот и думаю... куда... в ядро или в нвидию. наверное лучше в ядро %) на нвидию надеяться глупо (когда-то туда что-то слал).

BattleCoder ★★★★★ ()
Ответ на: комментарий от BattleCoder

Вот и думаю... куда... в ядро или в нвидию. наверное лучше в ядро %) на нвидию надеяться глупо (когда-то туда что-то слал).

Делай и там и там.

init_6 ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.