LINUX.ORG.RU

Линукс намертво зависает при работе от батареи

 , ,


0

1

Ноутбук ноунейм DEXP Mars Ryzen 6600H Radeon660M 16GB DDR5 При питании от сети все работает без единых нареканий. При питании от батареи абсолютно внезапно и непредсказуемо зависает намертво так, что в логах нет ничего, кроме

amdgpu 0000:e3:00.0: amdgpu: Dumping IP State Completed amdgpu 0000:e3:00.0: amdgpu: [drm] AMDGPU device coredump file has been created amdgpu 0000:e3:00.0: amdgpu: [drm] Check your /sys/class/drm/card1/device/devcoredump/data amdgpu 0000:e3:00.0: amdgpu: ring sdma0 timeout, signaled seq=15310, emitted seq=15310

Перепробовал все, что можно: изменять частоты (как высокие для предотвращения сна, так и низкие для предотвращения резких скачков энергопотребления и потенциальных просадок напряжения), писал все какие можно параметры ядра в /etc/defaults/grub, пытался повышать энергопакет для gpu, пытался удалять и всячески настраивать power-profiles-daemon, tlp - ничего. Нашел место, где чаще всего происходят такие зависания - rimworld через wine. Спустя 10-15 минут игры зависает. Уже не знаю, что делать. Пытался даже override таблиц acpi делать - ничего не работает. Проблема еще и в том, что после таких зависаний ноутбук не включается, пока не подключу его к сети. Так же отваливался еще и модуль вай-фая и так же не обнаруживался, пока к сети не подключил ноутбук. Биоса у ноунейм производителя нет нового. Самое главное - на винде не удалось обнаружить таких проблем. Я на ней не долго сидел на этом ноуте, но при стресс тестах и просто пользовании такого не обнаружил ни разу. Кстати, после такого зависания не грузится ни линукс, ни винда. Но в винде таких зависаний нет. Насилую нейросети в попытках найти ответ уже месяц. Я все уже перепробовал. И ведь главное, мне же не вернут деньги за ноут, потому что на винде все ок, да?

Ядра тоже разные пробовал, дистрибутивы пробовал дебиан и арч пробовал. Везде все одинаково



Последнее исправление: frgpoe (всего исправлений: 1)

Попробуй отключить управление энергосбережением: https://www.altlinux.org/%D0%9E%D1%88%D0%B8%D0%B1%D0%BA%D0%B0_pcieport

Для теста.

А вообще, проблема с профилями ACPI - пробуй обновлять BIOS (UEFI).

Кстати, после такого зависания не грузится ни линукс, ни винда.

И что делаешь? Переустанавливаешь?

kostik87 ★★★★★
()

Если дистрибутив Linux - Debian / Fedora - проверь, что нет ошибок в логе сообщений ядра об отсутствующих firmware.

Смотри вывод команды dmesg, можешь перенаправить на less

sudo dmesg | less

и проматывать стрелками или можешь искать по слову «firm», т.е. после перенаправления на less вывода нажимаешь клавишу «g» - для перехода в начало, затем нажимаешь клавишу «/» и допечатываешь внизу «firm», т.е. внизу будет написано «/firm», нажимаешь клавишу Enter и далее нажимая клавишу «n» - переходишь по найденному вхождению слова «firm», если там будет написано что-то вроде «firmware not found» - значит нужно разбираться, в особенности, если отношение к видео драйверам.

Найденные вхождения слова будут выделены белым фоном.

Для выхода клавиша «q».

Также:

  • G - перейти в конец
  • g - перейти в начало
  • N - искать в обратном направлении (вверх по тексту)
  • n - искать вниз по тексту
  • q - выход
kostik87 ★★★★★
()
Ответ на: комментарий от kostik87

Энергосбережение крутил как только можно, и штатными в kde утилитами, и нештатными, и вручную, и ryzenadj, cpupower - ничто не помогает.

После зависания не грузится ни линукс, ни винда до момента, пока не подключу питание от сети. Потом все работать начинает нормально.

frgpoe
() автор топика
Ответ на: комментарий от kostik87

В dmesg 0 вхождений о проблемах с firmware. Да я и не глупый, уже все что можно банальное перепробовал. Форумы тоже читал. У тех, у кого похожая проблема была, помогали настройки в биосе или аргументы загрузки ядра в grub, но у данной модели биос урезанный донельзя. Может и помогло бы.

frgpoe
() автор топика
Ответ на: комментарий от kostik87

Да. Как по отдельности, так и с другими. Я этих параметров уже очень много комбинаций переставил.

Не считаю себя глупым, на линуксе уже много месяцев, при том копаюсь именно в нем. Эта проблема с этим ноутбуком заставляет меня каждый вечер почти что-то пробовать, пока дома могу от сети его «раскирпичивать». Нейросети насиловал, форумы читал - ничего не помогает…

frgpoe
() автор топика
Ответ на: комментарий от frgpoe

Никто не говорит, что ты глупый, просто если ты пришёл на форум и тебе дали совет - отвечай, пожалуйста, что конкретно рекомендации в этом совете ты попробовал и что вышло, а не абстрактно «я чего только не писал в параметры ядра - не помогает» - не понятно, пробовал ты вообще именно этот совет или нет.

Можешь ещё посмотреть что было непосредственно перед моментом зависания в выводе journalctl -xe.

kostik87 ★★★★★
()
Ответ на: комментарий от kostik87

Да я без негатива, просто я отчаянии от этих ежедневных окирпичиваний в пути

journalctl -xe - NO ENTRIES. В разных ситуациях смотрел каждый раз потом логи, пытался с дампами памяти разобраться, но скилла не хватило. В логах, если зависает на раб.столе/браузере - полная пустота, если в вышеупомянутом rimworld через wine - то единственное выбивающееся из шума - это вот эти ошибки amdgpu, которые в изначальном сообщении написал. Исходя из этого логично предположить, что проблема может и не с amdgpu, но система запускается с acpi=off (отсюда и попытка оверрайд этих таблиц делать). Правда в разрешении 800х600, без тачпада как то не очень приятно работать… При оверрайде таблиц обнаружил, что там, на сколько понял, каких то секций нет. Я их дописал с помощью нейросетей и ошибка ACPI SYMBOL NOT FOUND, появляющаяся при запуске ОС, пропала. Но на частоту зависаний это никак не повлияло. Пишу это все для общей картины

frgpoe
() автор топика
Ответ на: комментарий от kostik87

Извиняюсь, при зависании в rimworld-wine вот такое еще есть при на Х11 (на вейланде пусто) фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: amdgpu 0000:e3:00.0: amdgpu: Dumping IP State Completed

фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: amdgpu 0000:e3:00.0: amdgpu: [drm] AMDGPU device coredump file has been created

фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: amdgpu 0000:e3:00.0: amdgpu: [drm] Check your /sys/class/drm/card1/device/devcoredump/data

фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: amdgpu 0000:e3:00.0: amdgpu: ring sdma0 timeout, signaled seq=15310, emitted seq=15310

frgpoe
() автор топика
Ответ на: комментарий от frgpoe

Ты видел, что под формой помещения сообщения на форум есть 3 кнопки «Поместить», «Предпросмотр» и «Отмена». Т.к. ты не глупый - объяснять их назначение не буду.

И ещё есть текст «Внимание: прочтите описание разметки Markdown» и последнее слово подчёркнуто - это ссылка.


фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: amdgpu 0000:e3:00.0: amdgpu: Dumping IP State Completed 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: amdgpu 0000:e3:00.0: amdgpu: [drm] AMDGPU device coredump file has been created 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: amdgpu 0000:e3:00.0: amdgpu: [drm] Check your /sys/class/drm/card1/device/devcoredump/data 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: amdgpu 0000:e3:00.0: amdgpu: ring sdma0 timeout, signaled seq=15310, emitted seq=15310 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: ————[ cut here ]———— 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: WARNING: CPU: 0 PID: 5202 at ./include/linux/dma-fence.h:585 amdgpu_job_timedout.cold+0x185/0x3b5 [amdgpu] 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: Modules linked in: ntfs3 tun snd_seq_dummy rfcomm snd_hrtimer snd_seq snd_seq_device ccm xt_mark xt_cgroup xt_MASQUERADE ip6t_REJECT nf_reject_ipv6 ipt_REJECT nf_reject_ipv4 xt_tcpudp ip6tabl> 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: bluetooth i2c_piix4 snd_timer thunderbolt i2c_smbus ccp snd rfkill soundcore ryzen_smu(OE) soc_button_array mousedev i2c_hid_acpi wireless_hotkey i2c_hid amd_pmc acpi_tad mac_hid i2c_dev cry> 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: CPU: 0 UID: 0 PID: 5202 Comm: kworker/u48:0 Tainted: G S OE 6.18.9-zen1-2-zen #1 PREEMPT(full) 4c6c2bbebeb2918ef9acc5dc7f5c30761b3b5894 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: Tainted: [S]=CPU_OUT_OF_SPEC, [O]=OOT_MODULE, [E]=UNSIGNED_MODULE 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: Hardware name: Hena Group Company Limited M15-A5W400/default, BIOS ARB938_V00.26DX3_ms 11/25/2024 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: Workqueue: amdgpu-reset-dev drm_sched_job_timedout [gpu_sched] 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: RIP: 0010:amdgpu_job_timedout.cold+0x185/0x3b5 [amdgpu] 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: Code: bd 6e 7a 05 00 00 0f 84 69 01 00 00 48 8b 7d 00 48 c7 c6 f8 21 9a c1 e8 70 aa 07 c1 49 8b 44 24 10 48 8b 50 70 80 e2 02 74 02 <0f> 0b c7 40 7c c2 ff ff ff 49 8b 7d 80 e8 d0 12 81 ff 84 > 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: RSP: 0018:ffffd1694086fd80 EFLAGS: 00010202 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: RAX: ffff8cc8316aa180 RBX: 0000000000000000 RCX: 000000000000000c 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: RDX: 0000000000000002 RSI: 0000000000000000 RDI: ffff8cc812ba67c0 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: RBP: ffff8cc812b80000 R08: ffffffff848b9401 R09: 0000000000000000 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: R10: ffffffff84861440 R11: ffffd1694086fab8 R12: ffff8cc7175fb400 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: R13: ffff8cc812ba6840 R14: ffff8cc7175fb400 R15: ffff8cc812ba68e0 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: FS: 0000000000000000(0000) GS:ffff8ccba90ac000(0000) knlGS:0000000000000000 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: CR2: 0000564ed9ca2fe0 CR3: 00000003e0a24000 CR4: 0000000000f50ef0 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: PKRU: 55555554 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: Call Trace: 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: ? __schedule+0x4da/0x2690 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: drm_sched_job_timedout+0x88/0x180 [gpu_sched c56a15e7946836a068ccaae3c54fced88775fce2] 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: process_one_work+0x193/0x350 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: worker_thread+0x254/0x3a0 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: ? __pfx_worker_thread+0x10/0x10 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: kthread+0xfc/0x240 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: ? schedule_tail+0xa0/0x360 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: ? __pfx_kthread+0x10/0x10 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: ret_from_fork+0x1c2/0x1f0 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: ? __pfx_kthread+0x10/0x10 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: ret_from_fork_asm+0x1a/0x30 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: —[ end trace 0000000000000000 ]— 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: amdgpu 0000:e3:00.0: amdgpu: GPU reset begin!. Source: 1 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: amdgpu 0000:e3:00.0: amdgpu: Guilty job already signaled, skipping HW reset 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: amdgpu 0000:e3:00.0: amdgpu: GPU reset(1) succeeded! 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan kernel: amdgpu 0000:e3:00.0: [drm] device wedged, but recovered through reset 
фев 15 00:00:03 DESKTOP-K7CB8ML.lan systemd[1]: Started Verify integrity of password and group files.

Так же лучше?

kostik87 ★★★★★
()
Ответ на: комментарий от frgpoe

Я думаю тут нужно максимально крутить как отключить режимы энергосбережения. У меня нет такого ноута, да и честно Dexp бы брать не стал, всё же ошибок в UEFI / ACPI и схемотехнике может быть много на китайцах, что оно работает сносно только под Windows.

Обновления BIOS нет?

kostik87 ★★★★★
()
Ответ на: комментарий от kostik87

Я думаю тут нужно максимально крутить как отключить режимы энергосбережения

Менял режимы работы power-profiles-daemon, менял его на tlp, пытался вручную менять governor (фиксировать его на performance), фиксировать частоты гпу (частоты цпу фиксировать стоит? или стоит в сторону с гпу копать?) Обновление биос искал, у производителя в интернете есть, на саму эту материнку не нашел в принципе.

Куда еще копать можно?

frgpoe
() автор топика
Ответ на: комментарий от frgpoe

Слушай, думаю в сторону использования Windows или работы от сети.

Гуглить подобные проблемы и проверять более новые ядра. Но думаю тут проблема в самом ноуте, а не в ядре Linux.

kostik87 ★★★★★
()

Ноутбук ноунейм DEXP Mars

Проблема явно в биосе, но dns явно не будет что-то делать для работы этого ноута под Linux… Поэтому продай его человеку, кто будет им пользоваться под windows, а себе купи другой.

Dimez ★★★★★
()
Последнее исправление: Dimez (всего исправлений: 1)
Ответ на: комментарий от kostik87

amdgpu.audio и amdgpu.bapm не пробовал. Попробовал с ними. Не могу сказать точно, помогают они или нет. За эти 2 часа во время игры зависания не произошло, но выйти из сна ноутбук во второй раз не смог. В логах все так же пусто

frgpoe
() автор топика
Ответ на: комментарий от frgpoe

у данной модели биос урезанный донельзя

Иногда можно перейти в расширенные настройки БИОС. У разных производителей по-разному. Не пробовал поискать (например, на 4pda)?

greenman ★★★★★
()