LINUX.ORG.RU

Почему кулер сходит с ума?

 ,


1

2

Иногда, после обновления ядра, кулер сходит с ума и мешает комфортно заниматься своими делами. В обычном состоянии он вращается со скоростью 2000-2100 оборотов, в «эти дни» скорость может достигать 2300, 2700, 3000 etc. Смена ядра тоже может и зачастую приводит к этой проблеме.

Вот для примера стабильное ядро:

uname -a
Linux host 5.17.4-arch1-1 #1 SMP PREEMPT Wed, 20 Apr 2022 18:29:28 +0000 x86_64 GNU/Linux

sensors
asus-isa-0000
Adapter: ISA adapter
cpu_fan:     2000 RPM
temp1:        +43.0°C

coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +44.0°C  (high = +87.0°C, crit = +105.0°C)
Core 0:        +44.0°C  (high = +87.0°C, crit = +105.0°C)
Core 1:        +45.0°C  (high = +87.0°C, crit = +105.0°C)

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +43.0°C  (crit = +108.0°C)

А вот libre:

uname -a
Linux host 5.17.3-gnu-2 #1 SMP PREEMPT Mon, 25 Apr 2022 20:19:01 +0000 x86_64 GNU/Linux

sensors
coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +45.0°C  (high = +87.0°C, crit = +105.0°C)
Core 0:        +45.0°C  (high = +87.0°C, crit = +105.0°C)
Core 1:        +44.0°C  (high = +87.0°C, crit = +105.0°C)

asus-isa-0000
Adapter: ISA adapter
cpu_fan:     2700 RPM
temp1:        +44.0°C

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +44.0°C  (crit = +108.0°C)

Как решить эту хурму с помощью lm-sensors+fancontrol я так и не понял… А вот NBFC заработал с пол пинка, но хотелось бы понять причину и найти решение.

Если нужна дополнительная инфа -спрашивайте.

Ответ на: комментарий от The_Coon

во-первых, проверить в биосе (если это позволяет) - на какой источник температуры опирается контроллер. во-вторых, проверить пороги температуры, при которых меняется скорость вента. мб он у тебя там на 50с на 100% крутится. в третьих - пойти в магаз и купить подходящий noctua. или у тебя ноут?

vvviperrr ★★★★★
()
Последнее исправление: vvviperrr (всего исправлений: 4)
Ответ на: комментарий от vvviperrr

во-первых, проверить в биосе (если это позволяет) - на какую темп опирается контроллер.

Это ноут, таких опций нет, потому что бивис кастрированый.

во-вторых, проверить пороги температуры, при которых меняется скорость вента. мб он у тебя там на 50с на 100% крутится.

На память:

  • 45° 2000 RPM
  • 47° 2100 RPM
  • 50° 2300 RPM

При этих показателях кулер еле слышен.

в третьих - пойти в магаз и купить подходящий noctua.

Не представляю как я его в ноут внедню)

The_Coon
() автор топика

если ноут - вскрыть и посмотреть на предмет забития пылью кулера. если не чистилось пару лет - там все забито пылью и он не охлаждается.

межреберное пространство кулера продуть клизмой и прочистить спичками. по месту активно применять пылесос.

alysnix ★★★
()
Ответ на: комментарий от The_Coon

Что, ни у кого нет никаких идей? :(

есть! есть идея запустить какой-нить монитор загрузки проца и смотреть, что грузит проц и зачем.

alysnix ★★★
()
Последнее исправление: alysnix (всего исправлений: 1)
Ответ на: комментарий от The_Coon

температура почти одна и так же

потому что,

кулер воет

Материнка(?) удерживает таргет по температуре за счёт оборотов.

Учитывая:

(high = +87.0°C, crit = +105.0°C)

, думаю, можно поставить таргет 65, например.

ephecaff
()

Может cpufreq не понижает частоту и вольтаж.
Может видео.
Может хлам который не работает как нужно если не windows.
Ноуты некоторые нужно полностью выключать иначе после перезагрузки не работает хлам.

naKovoNapalBaran
()
Последнее исправление: naKovoNapalBaran (всего исправлений: 1)

Почему кулер сходит с ума?

Почему я сошел с ума?

А ты просто scheduler принудительно закинь в powersave. И живи на LTS. Дальше убери всякие защиты (ой, память, ой, meltdown, ой небезапасна!). Сильно давят. И смотри, что живёт своей жизнью в фоне.

Дальше, смотри на GPU. Если встройка, то надо принудительные танцы.

Реальные профи, как я, собирают ядра вручную. Заодно они не обновляют непонятно что и непонятно куда, а читают changelog.

Как результат - youtube на 480p - 47 градусов. При 50 начинает работать система охлажения. Так что тихо всё… И батарея не жрётся.

Oldboy
()

Это известная проблема, висящая багом на ланчпаде уже 12 лет.

https://bugs.launchpad.net/ubuntu/+source/lm-sensors-3/+bug/576602

https://github.com/lm-sensors/lm-sensors/issues/227

Заключается в том, что fancontrol обращается к датчикам и pwm вентиляторов через sysfs, где они указаны как hwmon0, hwmon1 и т.д. Нумерация задаётся в порядке загрузки модулей. Из-за различий в ядрах и состояния модулей ([Y] или [M]) их инициализация происходит в произвольном порядке. Это видно и в вашем выводе sensors: на первой системе перечисление начинается с asus-isa-0000, а на второй - с coretemp-isa-0000.

Я рекомендую все модули собирать отдельно от ядра [M] и не встраивать в initramfs, позволяя их подхватывать с помощью modprobe уже при основной загрузке системы. Я не знаю, как точно называются у вас модули, отвечающие за сенсоры, поэтому следующую команду приведите в порядок в соответствии с выводом lsmod.

Создадим искусственную зависимость модулей, чтобы предопределить порядок их загрузки:

sudo sh -c "echo -n 'softdep acpitz-acpi pre: coretemp\nsoftdep coretemp pre: asus' > /etc/modprobe.d/fancontrol.conf"

И обновим initramfs:

sudo update-initramfs -k all -u
knstntsin
()
Ответ на: комментарий от ephecaff

Взлетает – это состояние кулера, при котором устройству кажется, что на данный момент оно квадрокоптер. В этом состоянии оно (устройство) увеличивает скорость вентиляторов и начинает «взлетать» (как квадрокоптер). Обычно «взлет» терпит фиаско, но при наличии технической возможности может улететь.

The_Coon
() автор топика
Ответ на: комментарий от Oldboy

Почему кулер сходит с ума?

Почему я сошел с ума?

Oldboy

Хм, хм, хм!

Дальше, смотри на GPU. Если встройка, то надо принудительные танцы.

Гибридное видео (Интол+невидия, которая отключена)

The_Coon
() автор топика
Ответ на: комментарий от knstntsin

Звучит довольно убедительно. Кто из списка замешан в делах с сенсорами?

lsmod
Module                  Size  Used by
ccm                    20480  3
nft_ct                 20480  1
nf_conntrack          180224  1 nft_ct
nf_defrag_ipv6         24576  1 nf_conntrack
nf_defrag_ipv4         16384  1 nf_conntrack
nf_tables             274432  7 nft_ct
libcrc32c              16384  2 nf_conntrack,nf_tables
nfnetlink              20480  1 nf_tables
bbswitch               24576  0
intel_rapl_msr         20480  0
intel_rapl_common      32768  1 intel_rapl_msr
ath3k                  24576  0
ath9k                 188416  0
x86_pkg_temp_thermal    20480  0
btusb                  65536  0
ath9k_common           40960  1 ath9k
vfat                   24576  1
intel_powerclamp       20480  0
btrtl                  28672  1 btusb
ath9k_hw              528384  2 ath9k_common,ath9k
fat                    86016  1 vfat
btbcm                  24576  1 btusb
btintel                45056  1 btusb
coretemp               20480  0
ath                    40960  3 ath9k_common,ath9k,ath9k_hw
btmtk                  16384  1 btusb
mac80211             1216512  2 ath9k,ath9k_hw
bluetooth             856064  7 btrtl,btmtk,btintel,btbcm,ath3k,btusb
snd_hda_codec_hdmi     81920  1
kvm_intel             389120  0
libarc4                16384  1 mac80211
snd_hda_codec_realtek   167936  1
snd_hda_codec_generic    98304  1 snd_hda_codec_realtek
ledtrig_audio          16384  1 snd_hda_codec_generic
snd_hda_intel          61440  3
snd_intel_dspcfg       36864  1 snd_hda_intel
snd_intel_sdw_acpi     20480  1 snd_intel_dspcfg
snd_hda_codec         180224  4 snd_hda_codec_generic,snd_hda_codec_hdmi,snd_hda_intel,snd_hda_codec_realtek
cfg80211             1064960  4 ath9k_common,ath9k,ath,mac80211
snd_hda_core          114688  5 snd_hda_codec_generic,snd_hda_codec_hdmi,snd_hda_intel,snd_hda_codec,snd_hda_codec_realtek
kvm                  1089536  1 kvm_intel
asus_nb_wmi            28672  0
ecdh_generic           16384  1 bluetooth
asus_wmi               65536  1 asus_nb_wmi
sparse_keymap          16384  1 asus_wmi
platform_profile       16384  1 asus_wmi
snd_hwdep              16384  1 snd_hda_codec
snd_pcm               163840  4 snd_hda_codec_hdmi,snd_hda_intel,snd_hda_codec,snd_hda_core
snd_timer              45056  1 snd_pcm
snd                   126976  14 snd_hda_codec_generic,snd_hda_codec_hdmi,snd_hwdep,snd_hda_intel,snd_hda_codec,snd_hda_codec_realtek,snd_timer,snd_pcm
irqbypass              16384  1 kvm
soundcore              16384  1 snd
rfkill                 32768  7 ath9k,asus_wmi,bluetooth,cfg80211
iTCO_wdt               16384  0
rapl                   16384  0
intel_pmc_bxt          16384  1 iTCO_wdt
intel_cstate           20480  0
mxm_wmi                16384  0
iTCO_vendor_support    16384  1 iTCO_wdt
wmi_bmof               16384  0
intel_uncore          208896  0
mei_hdcp               24576  0
mei_pxp                20480  0
alx                    57344  0
psmouse               212992  0
joydev                 28672  0
mousedev               24576  0
pcspkr                 16384  0
mdio                   16384  1 alx
i2c_i801               45056  0
i2c_smbus              20480  1 i2c_i801
mei_me                 53248  2
mei                   167936  5 mei_hdcp,mei_pxp,mei_me
lpc_ich                28672  0
mac_hid                16384  0
asus_wireless          20480  0
wmi                    40960  3 asus_wmi,wmi_bmof,mxm_wmi
ipmi_devintf           20480  0
ipmi_msghandler        77824  1 ipmi_devintf
fuse                  172032  5
crypto_user            20480  0
bpf_preload            16384  0
x_tables               57344  0
ext4                  987136  1
crc32c_generic         16384  0
crc16                  16384  2 bluetooth,ext4
mbcache                16384  1 ext4
jbd2                  188416  1 ext4
crypto_simd            16384  0
xts                    16384  1
ecb                    16384  1
dm_crypt               61440  1
cbc                    16384  0
encrypted_keys         28672  1 dm_crypt
dm_mod                184320  3 dm_crypt
trusted                45056  2 encrypted_keys,dm_crypt
asn1_encoder           16384  1 trusted
tee                    40960  1 trusted
tpm                    98304  1 trusted
rng_core               16384  1 tpm
usbhid                 73728  0
crct10dif_pclmul       16384  1
crc32_pclmul           16384  0
serio_raw              20480  0
atkbd                  36864  0
crc32c_intel           24576  3
libps2                 20480  2 atkbd,psmouse
ghash_clmulni_intel    16384  0
cryptd                 28672  2 crypto_simd,ghash_clmulni_intel
xhci_pci               20480  0
xhci_pci_renesas       24576  1 xhci_pci
i8042                  45056  1 asus_nb_wmi
serio                  28672  9 serio_raw,atkbd,psmouse,i8042
i915                 3330048  14
intel_gtt              28672  1 i915
video                  57344  2 asus_wmi,i915
ttm                    86016  1 i915

После обновления initramfs нужно что-то еще сделать, перезагрузиться, например?

PS. Еще, как вернуть эти изменения назад?

The_Coon
() автор топика
Последнее исправление: The_Coon (всего исправлений: 1)
Ответ на: комментарий от The_Coon

# echo 1 > /sys/devices/system/cpu/intel_pstate/no_turbo

Убирает turbo boost до перезагрузки.

Как и писал выше, поменять принудительно governor на powersave

echo powersave | sudo tee /sys/devices/system/cpu/cpu[0-9]*/cpufreq/scaling_governor

Узнать версию проца и начать тюнить встройку, чтобы под неё все нужные модули firmware, vaapi, кодеки.

Позже надо читать, тчо и куда в фоне лазит, допустим, в Лисе. Конфигурируешь, уменьшается нагрузка, ты становишься более защищённым, смотришь остальной набор ПО, начинаешь разбираться в теме, становишься крутым, пишешь холопам на LOR, блеск!

Oldboy
()
Последнее исправление: Oldboy (всего исправлений: 1)
Ответ на: комментарий от Partisan

У меня на ноуте только при компиляции или на 1080p включается система охлаждения. Я за тишину, но плюс в том, что батареи мне хватает почти на сутки (23 часа) полноценной, подчеркну, полноценной работы.

Oldboy
()
Ответ на: комментарий от The_Coon

И правда, конкретики из lsmod мало…

Воспользуйтесь

sudo sensors-detect --auto

Те Driver, что попали в итог, и есть то, что нам нужно.

Для отката просто удаляем sudo rm /etc/modprobe.d/fancontrol.conf и обновляем initramfs.

knstntsin
()
Ответ на: комментарий от knstntsin

У меня там только coretemp, поэтому взял только первую строчку, как есть. Образ пересобрал. Пробовал на стабильном, libre и hardened ядрах. Изменений нет или я их не вижу/слышу.

The_Coon
() автор топика

На какой-то день Орлиный глаз заметил, что модуль bbswitch на libre ядре у него не загружается. Графика-то, блин, гибридная! Только невидия програмно отключена.

Ок, bumblebeed.service есно сыпет ошибки:

● bumblebeed.service - Bumblebee C Daemon
     Loaded: loaded (/etc/systemd/system/bumblebeed.service; enabled; vendor preset: disabled)
     Active: active (running) since Wed 2022-05-04
   Main PID: 445 (bumblebeed)
      Tasks: 1 (limit: 4539)
     Memory: 1.0M
        CPU: 18ms
     CGroup: /system.slice/bumblebeed.service
             └─ 445 /usr/bin/bumblebeed

Started Bumblebee C Daemon.
modprobe: FATAL: Module bbswitch not found in directory /lib/modules/5.17.3-gnu-3
[ERROR]Module bbswitch could not be loaded (timeout?)
[WARN]No switching method available. The dedicated card will always be on.
[INFO]/usr/bin/bumblebeed 3.2.1 started

Пробую загрузить модудь врукопашную, но не получается:

sudo modprobe bbswitch
modprobe: FATAL: Module bbswitch not found in directory /lib/modules/5.17.3-gnu-3

И тут я замечаю в репах пакет bbswitch-dkms, который и поставил, заменив простой bbswitch. Выключил ноут и снова включил и кулер замолчал!

uname -a
Linux host 5.17.3-gnu-3 #1 SMP PREEMPT Tue, 03 May 2022 12:18:43 +0000 x86_64 GNU/Linux

sensors                                 
asus-isa-0000
Adapter: ISA adapter
cpu_fan:     2100 RPM
temp1:        +44.0°C  

coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +46.0°C  (high = +87.0°C, crit = +105.0°C)
Core 0:        +46.0°C  (high = +87.0°C, crit = +105.0°C)
Core 1:        +45.0°C  (high = +87.0°C, crit = +105.0°C)

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +44.0°C  (crit = +108.0°C)

Разъясните, пожалуйста, почему на стабильном ядре все работало с обычным bbswitch, а в libre только с bbswitch-dkms?

The_Coon
() автор топика
Ответ на: комментарий от The_Coon

Так так bbswitch критериям libre не соответствует и его там нет?


В libre (свободном) не было несвободных прошивок для устройств (такова есть, собственно, его цель), но ползатель сказал, что хочет сам (-dkms) взять проприетарные (или сторонние) дрова и скомпилять из них, используя проприетарные (сторонние) прошивки.

А в стабильном ту проприетарщину (или третьестороннее) уже готовую положили, кто хочет кушайте, не обляпайтеся.

А железо что пуля — дура, есть прошивка — работает, нет прошивки — само не работает, пусть CPU отдувается за всех (эмулирует программно, выполняя всю ту железкину работу сам на себе собой погоняя), а карлсон пусть перегрева не допускает...

bormant ★★★★★
()
Последнее исправление: bormant (всего исправлений: 5)
Ответ на: комментарий от The_Coon

С linux-hardened тоже самое. Но там и температура выше, чем в других ядрах, из-за коичества секурных настроек и патчей.

Чего? Может у тебя блоб какой-нить не подхватывается на другом ядре?

MaZy ★★★★★
()
Ответ на: комментарий от MaZy

Думаю, там не блоб, а bbswitch не подгружается. Но лень сейчас это проверять. Не знаю, какие там различия между bbswitch и bbswitch-dkms, но в вики сказано, что первый пакет для стабильного ядра, а второй для lts и кастомных ядер.

The_Coon
() автор топика