LINUX.ORG.RU

NVMe диск греется сильно в debian

 , , , ,


0

4

Установил в ноутбук Asus TUF fx505g nvme ssd kingston kc3000 на 2tb вместо m2.sata adata. Стоит две системы - win10 со всеми обновлениями и драйверами и debian bookworm 12.4.

В windows 10 при отсутствии нагрузки температура примерно остается на уровне 32-36 градусов. В debian стоит только i3 и при пустом экране температура доходит до 60-70 градусов.

Я думал сначала, что датчики врут, однако даже корпус ноутбука на ощупь горячий при запущенном debian.

APSTE включен, journalctl пишет, что aspm не поддерживается. Винда пишет, что ASPM включен на l1 уровень.

Можете подсказать, в чем может быть проблема?



Последнее исправление: tsobako (всего исправлений: 1)

Могу сказать, что у меня в десктопе (ASUS B550-CREATOR) на стабильном Debian KC3000 (512 Gb) имел нормальные температуры, ближе к тем, что у тебя в Windows, что-то в районе сорока градусов. Аномалий не было и в ASUS PN41, а в этом кипятильнике было бы заметно.

Это я к тому, что проблему надо искать в направлении ноутбука. Либо в ядре баг, либо в ноутбуке какой-нибудь кривой ACPI. Но прежде чем форсить ASPM можно попробовать ядро из бэкпортов.

anonymous
()

Может для начала iotop запустить? Может какая-то программа постоянно дёргает диск?

Xenius ★★★★★
()

С чего ты взял что греется именно ссд? Может это проц нагрелся и нагрел всё вокруг себя?

firkax ★★★★★
()
Ответ на: комментарий от firkax

Процессор и видеокарта расположены выше клавиатуры, ближе к экрану. SSD находится под numpad’ом. Я сам разбирал его не раз и расположение всех деталей видел, да и процессор вообще не особо греется в данный момент - даже кулер не работает

tsobako
() автор топика
Ответ на: комментарий от tsobako

Тогда попробуй наоборот откатиться на 5.4 или 5.10. Ядро можно вручную взять из какого-нибудь дистрибутива, например Slackware64 и распаковать, там нужен для загрузки будет файл ядра, возможно initrd и каталог модулей.

Xenius ★★★★★
()
Последнее исправление: Xenius (всего исправлений: 1)
Ответ на: комментарий от greenman

Официальная утилита говорит, что firmware самый свежий

tsobako
() автор топика

aspm не поддерживается

Попробуй принудительно включи.

Dimez ★★★★★
()

Посмотрите вывод nvme:

sudo nvme smart-log /dev/nvme0n1   # название устройства из lsblk
sudo nvme error-log /dev/nvme0n1
dmitry237 ★★★★★
()
Ответ на: комментарий от tsobako

Это притом я уже поставил debian11 с ядром 5.10

tsobako
() автор топика

debian bookworm 12.4.

А попробуй ubuntu live с флешки запустить, там какая температура будет у nvme?

Dimez ★★★★★
()
Ответ на: комментарий от pekmop1024

get-feature:0xc (Autonomous Power State Transition), Current value:0x000001 Autonomous Power State Transition Enable (APSTE): Enabled Entry[ 0]
Idle Time Prior to Transition (ITPT): 500 ms Idle Transition Power State (ITPS): 3 Entry[ 1]
Idle Time Prior to Transition (ITPT): 500 ms Idle Transition Power State (ITPS): 3 Entry[ 2]
Idle Time Prior to Transition (ITPT): 500 ms Idle Transition Power State (ITPS): 3 Entry[ 3]
Idle Time Prior to Transition (ITPT): 500 ms Idle Transition Power State (ITPS): 4

C 4 по 31 entry - все по нулям

tsobako
() автор топика
Ответ на: комментарий от pekmop1024

У меня, например, PM9A3 - они вообще спать не умеют (так задумано производителем для снижения задержек). А тот же PM983 - умеет.

pekmop1024 ★★★★★
()
Ответ на: комментарий от pekmop1024

Поигрался с default_ps _max_latency_us (ставил и 0, и 2500, и 5500, и 10000) - ничего не изменилось, температура 54

При этом команда

nvme get-feature /dev/nvme0 -f 2 -H

выдает, что диск в состоянии 4 (которое потребляет 0.062w, а не 8.8, 7.1 или 5.2, как в рабочих состояниях)

tsobako
() автор топика

Посмотри процессы что пишут на диск:

sudo iotop -obPat
В какие файлы идет запись, или чтение:
sudo fatrace -f W
Можно собрать статистики:
sudo btrace -w 600 -a write /dev/sda
Уже будет понятно что к чему.

hbars ★★★★★
()
Последнее исправление: hbars (всего исправлений: 1)
Ответ на: комментарий от tsobako

Процесса такого не было - монтировал я сам через стандартную gui-утилиту disks

Какая разница, чем монтировал?

Dimez ★★★★★
()

Понятия не имею, у меня была куча версий ubuntu и nvme диски intel и samsung, никаких проблем с температурами и расходом батареи.

Но если есть технические вопросы такого рода то рекомендую сперва искать по ключевым словам + Arch и тогда поисковик тебя приведет на arch wiki. Там обычно актуальная инфа и способы решения типовых проблем. Единственное что какие-нибудь приведенные cli утилиты не окажутся в репозиатарии твоего дистра.

Aber ★★★★★
()
Ответ на: комментарий от Dimez

Довольно странно, что оно не отключено по умолчанию для SSD.

anonymous
()
Ответ на: комментарий от tsobako

пересоздал фс

Какой командой?

И зачем, если можно было просто подождать, пока закончится эта хрень.

anonymous
()
Ответ на: комментарий от anonymous

Да я уже попробовал еще арч самый свежий поставить - там и пересоздал систему.

И выключал журналирование на корневом разделе - всё равно ничего

tsobako
() автор топика
Ответ на: комментарий от anonymous

При установке арча я сделал

mkfs.ext4 -L «Home» /dev/nvme0n1p7 -E lazy_itable_init=0,lazy_journal_init=0

mkfs.ext4 -L «Linux» /dev/nvme0n1p5 -E lazy_itable_init=0,lazy_journal_init=0

Достаточно информативно?

tsobako
() автор топика
Ответ на: комментарий от tsobako

Но температура высокая осталась? Попробуй всё же включить ASPM. Для проверки можно это попробовать сделать через powertop, по крайней мере, раньше такая возможность там была.

anonymous
()
Ответ на: комментарий от anonymous

Включил через флаг pcie-aspm=force в grub

В логах journalctl пишет

PCIe ASPM is forcibly enabled
ACPI FADT declares the system doesn't support PCIe ASPM, so disable it
acpi PNP0A08:00: _OSC: OS Supports [.. ASPM ..]
acpi PNP0A08:00: FADT indicates ASPM is unsupported, using BIOS configuration
tsobako
() автор топика
Ответ на: комментарий от tsobako

Ну то есть кривой ACPI всё же. Попробуй добавить к теме тег «acpi» или создай новую с уже более конкретной проблемой. Я просто не помню, кто здесь хорошо разбирался в этом вопросе, но такие точно были. Сначала только убедись, что не помогло. И ещё можно попробовать параметр ядра acpi_osi=Linux перед этим, есть шанс, что поможет.

anonymous
()
Ответ на: комментарий от anonymous

Включил acpi_osi=Linux в сочетании с pcie_aspm=force - ничего не поменялось.

Запустил тест fwts aspm (уже без флагов выше) - 3 warning.

WARNING: Test 2, RP 0000h:00h:1Dh.04h L0s not enabled.
WARNING: Test 2, Device 0000h:03h:00h.00h L0s not enabled.

WARNING: Test 2, RP 0000h:00h:1Dh.00h L0s not enabled.

Сами устройства оказались

00:1d.0 PCI bridge: Intel Corporation Cannon Lake PCH PCI Express Root Port #9 (rev f0)
00:1d.4 PCI bridge: Intel Corporation Cannon Lake PCH PCI Express Root Port #13 (rev f0)
03:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8211/8411 PCI Express Gigabit Ethernet Controller (rev 15)

tsobako
() автор топика
Ответ на: комментарий от tsobako

А если оставить acpi_osi=Linux в сочетании с pcie_aspm=force, то еще и L1 отключается

WARNING: Test 2, RP 0000h:00h:1Dh.04h L1 not enabled.
WARNING: Test 2, Device 0000h:03h:00h.00h L1 not enabled.
tsobako
() автор топика
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.