LINUX.ORG.RU

Ryzen 7600 под Mint 21 - скачет температура в lm-sensors

 , ,


0

1

Кратко: есть десктоп на процессоре Ryzen 7600, под Mint 21.3. Датчики температуры определяются в lm-sensors и работают правдоподобно, но если смотреть временную развертку, то без всякой нагрузки температура постоянно осциллирует, иногда больше 15 С. Пытаюсь понять, это проблема процессора, ядра, или чего. Скриншот psensor: https://preview.redd.it/ryzen-7600-temperature-jumping-in-mint-21-v0-gyx4sbxvjfdf1.png?width=1846&format=png&auto=webp&s=a1b73832ab93cc854ef4a37091cbfe261b81a82f

Подробно: процессор AMD Ryzen 5 7600, тепловой пакет 65 Вт. Материнка - Gigabyte B650M D3HP. Охлаждается башней id-Cooling с типовой мощностью рассеяния 120 Вт. Посажена собственноручно на нормальную термопасту год назад. Оперативки 32 Гб, система на SSD.

Система: Linux Mint 21.3 Virginia (base: Ubuntu 22.04 jammy). Оболочка Xfce 4.18.1. Регулярно обновляется все через apt-get, включая ядро.

Изначально с определением температуры процессора были проблемы, но после некоторых апдейтов и мануальных подкручиваний в lm-sensors появилось, кажется, всё что нужно. Так, в выводе присутствуют:

k10temp-pci-00c3
Adapter: PCI adapter
Tctl: +52.2°C
Tccd1: +41.1°C

gigabyte_wmi-virtual-0
Adapter: Virtual device
temp1: +39.0°C
temp2: +59.0°C
temp3: +52.0°C
temp4: +45.0°C
temp5: +55.0°C
temp6: +58.0°C 

Как я понял после курения форумов, в том числе и этого - Tctl есть некая синтетическая температура, используемая для контроля кулера процессора. А Tccd1 есть собственно температура самого чипа. Из датчиков гигабайтовской материнки третий, судя по всему, показывает температуру проца, просто со стороны материнской платы. Вот я вывел их все три в psensors, смотрю - а Tccd1 шатается на 8-15 С постоянно. При этом просто запущен Хром с рабочими вкладками, Slack и десктопная телега. То есть нагрузки примерно никакой. Почему может так скакать отображение датчиков?



Последнее исправление: teonik (всего исправлений: 1)

То есть нагрузки примерно никакой.

Это теория. А что показывает объективный контроль? htop, например, в нем ещё можно настроить поядерное отображение частоты. Просто все три приложения это нехилая такая блоатварь

cobold ★★★★★
()
Ответ на: комментарий от anonymous

если бы все было просто так, то наблюдался бы спайк в момент буста, который потом выполаживался бы до равновесного значения. А тут как будто ядро все время бустится, и сваливается обратно

teonik
() автор топика
Ответ на: комментарий от teonik

А тут как будто ядро все время бустится, и сваливается обратно

А оно так и делает. Возьми s-tui, запусти с рут правами и смотри на частоты, потребление и температору.

anonymous
()
Ответ на: комментарий от teonik

в данном случае идеальным будет collectd, с включенными модулями температур и частот ядер. потом можно будет вывести их на один график, скажем, в kcollectd, и всё станет видно.

anonymous
()

а с чего ты взял что lm_sensors реальную температуру показывает? да и у современных процов, видюх рабочие температуры под 95-98 градусов. если температура ненормальная, то у тебя все зависнет, выключится или перегрузится, когда в защиту оборудование уходит

rtxtxtrx ★★★
()
Ответ на: комментарий от anonymous

какие те патчи нужны? я много жалоб видел, что у определенных моделей ssd темепературы на датчиках от балды стоят и тп. теоретически и с опр процессором могут быть проблемы (хоть amd и в ядре). просто нужно свыкнуться с мыслью, что программный код не лишен багов, часто написан как попало, а поэтому полагаться на циферки всякие не стоит. нужно сравнивать вывод в винде/линупсе чтобы прийти к общему знаменателю… да ему уже совет дали поставить новое ядро в надежде что в нем баг этот исправили… а там неизвестно что было: или показатели от балды показывал, или реально частоты в простое скакали… в этих делах железных там важны прошивка матери, версия ядра, микрокод (загружен он? какой версии?). самое просто решение: обновить прошивку, обновить ядпо и микрокод до последних либо перейти на арч (минты хороши только на старом железе, где все баги отловили и справили, а для нового нужно только роллинг использовать или получишь проблему как выше)

rtxtxtrx ★★★
()
Последнее исправление: rtxtxtrx (всего исправлений: 1)

То есть нагрузки примерно никакой

Это кажется. Даже опрос датчиков создаёт короткую нагрузку и может влиять на переход процессора в более низкие C-states. В целом выглядит всё нормально. Использование amd-pstate может немного улучшить управление питанием.

anonymous
()

Ну так поставь кулер нормально. У AMD ядра смещены и даже под водянкой бадет градусов 15 сверху в сравнении с оффсетом. Андервольт туда же. Материнка лупит напряжение, которого с большим запасом хватает на частоты. И вот тут на AMD придется выбирать между производительностью и эффективной частотой ядра. На интеле можно ставить с минимальным напряжением для частоты и все будет работать. Хотя учитывая тот факт что почти никто не разобрался с выпрямлением напряжений на интеле, то на AMD есть шанс настроить нечто похожее. Я для 12900К делал ограничение для всех ядер на 4800. Дальше настраивается напряжение для шага в 400 МГц хоть до 6ГГц и это застрявшие в прошлом называют разгоном. У них обычно лютейший перегиб по напряжениям и настроена только самая высокая частота, хотя pstate позволяет кочегарить меньше когда этого не требуется. Эти же особи пускали слух о падении производительности AMD при андервольте, но верить им - себя не уважать. Потому что там рядовые черви прикидываются вечно гуру оверклокинга.

anonymous
()

Вот такие температуры у 12900К на ядрах в жару. Ну то есть у тебя просто лютый случай.


coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +32.0°C  (high = +80.0°C, crit = +100.0°C)
Core 0:        +29.0°C  (high = +80.0°C, crit = +100.0°C)
Core 4:        +24.0°C  (high = +80.0°C, crit = +100.0°C)
Core 8:        +28.0°C  (high = +80.0°C, crit = +100.0°C)
Core 12:       +31.0°C  (high = +80.0°C, crit = +100.0°C)
Core 16:       +30.0°C  (high = +80.0°C, crit = +100.0°C)
Core 20:       +30.0°C  (high = +80.0°C, crit = +100.0°C)
Core 24:       +29.0°C  (high = +80.0°C, crit = +100.0°C)
Core 28:       +27.0°C  (high = +80.0°C, crit = +100.0°C)
Core 32:       +29.0°C  (high = +80.0°C, crit = +100.0°C)
Core 33:       +29.0°C  (high = +80.0°C, crit = +100.0°C)
Core 34:       +29.0°C  (high = +80.0°C, crit = +100.0°C)
Core 35:       +29.0°C  (high = +80.0°C, crit = +100.0°C)
Core 36:       +29.0°C  (high = +80.0°C, crit = +100.0°C)
Core 37:       +29.0°C  (high = +80.0°C, crit = +100.0°C)
Core 38:       +29.0°C  (high = +80.0°C, crit = +100.0°C)
Core 39:       +29.0°C  (high = +80.0°C, crit = +100.0°C)

В то же время память

spd5118-i2c-17-52
Adapter: SMBus I801 adapter at 0000:00:1f.4
temp1:        +34.5°C  (low  =  +0.0°C, high = +55.0°C)
                       (crit low =  +0.0°C, crit = +85.0°C)

spd5118-i2c-17-50
Adapter: SMBus I801 adapter at 0000:00:1f.4
temp1:        +34.5°C  (low  =  +0.0°C, high = +55.0°C)
                       (crit low =  +0.0°C, crit = +85.0°C)

spd5118-i2c-17-53
Adapter: SMBus I801 adapter at 0000:00:1f.4
temp1:        +34.2°C  (low  =  +0.0°C, high = +55.0°C)
                       (crit low =  +0.0°C, crit = +85.0°C)

spd5118-i2c-17-51
Adapter: SMBus I801 adapter at 0000:00:1f.4
temp1:        +34.8°C  (low  =  +0.0°C, high = +55.0°C)
                       (crit low =  +0.0°C, crit = +85.0°C)
anonymous
()

Какая тебе разница какие там цифирьки показываются. Глючит? Кулер орёт? Нет, так расслабься и займись делом. Текущая температура проца/ядра бред, да и все эти сенсоры зачастую показывают погоду на марсе, глаза царапаются или хочешь быть кульхацкером? Скармливай вывод перловому однострочнику он будет вывод усреднять, там будет правильная красивая цифирька, на которую ты с умным видом будешь любоваться. 😃

vtVitus ★★★★★
()
Последнее исправление: vtVitus (всего исправлений: 1)