LINUX.ORG.RU

Постоянно моргает hdd led на корпусе в iotop тишина.

 , ,


0

1

Такая вот странная ситуация. Поставил новую мамку и обратил внимание, что постоянно моргает индикатор жесткого диска на передней панели корпуса, причем с постоянной частотой - два раза в секунду, кратковременно. При этом iotop активности особой не показывает, jbd2 время от времени пишет и все.
В системе два одинаковых ssd (samsung 970 pro 512gb), один на мамке, другой на переходнике в pci-e 16х.
Тот, что на мамке - под систему отведен. Причем, обратил внимание, что греется несколько сильнее, и временами разогревается при отсутствии сильного трафика градусов до 75 (контроллер, память - 55). По тому, что в переходнике - светодиоды на переходнике моргают с той же частотой, что и hdd-led на корпусе! Что бы это могло быть, куда копнуть? Вроде на старой мамке таких экзерцисов не наблюдал.
Мамка giabyte a520mk v2 rev1.1, биос последний обновлен, проц Ryzen 4650Pro, видюха встроенная. В биосе настройки дефолтные + включена поддержка виртуализации. Стоковый Debian12+KDE.


В какой момент мигание начинается? Останови систему на этапе grub, в initramfs, после запуска ядра но без гуи, сравни.

firkax ★★★★★
()
Ответ на: комментарий от firkax

В биосе не дергает, в меню граба - тоже, даже более того - не дергает на этапе логина в КДЕ, чисто прогружаются службы и все - тишина. Зато стоит залогиниться и всё - пошло-поехало.

sptim
() автор топика
Ответ на: комментарий от Dimez

Это точно можно исключить, диски размечены сто лет назад.
И потом, разве ленивая инициализация - это не на проце? А значит должна отображаться в iotop.

sptim
() автор топика
Ответ на: комментарий от Dimez

Замечу, что лишь временами. Греется системный, что на M2 мамки. А моргают светодиоды на том, что в переходнике на pci-e слоте (но не знаю, это отображение обращений именно к нему, или просто индикация обращений к дискам вообще, может быть такое?).

sptim
() автор топика
Ответ на: комментарий от sptim

Создай нового юзера, залогинься в него и сравни.

И ещё способ: смотришь список процессов юзера, ставишь всем kill -STOP (переключившись на другую консоль рута например т.к. юзерская зависнет после этого), проверяешь что диск перестал дёргаться, потом включаешь их по одному (kill -CONT) и смотришь когда начнётся.

firkax ★★★★★
()

HDD led может мигать при мониторинге смарта, например. У меня одно время в коньках стоял индикатор температуры диска. Он каждые 5 секунд обновлялся и каждые 5 секунд моргал hdd led.

u5er ★★★
()
Ответ на: комментарий от sptim

А значит должна отображаться в iotop.

iotop кривое всё, может чего-то не видеть, вот в freebsd есть gstat там нормально дисковую нагрузку можно смотреть.

firkax ★★★★★
()
Ответ на: комментарий от u5er

Ну не два раза в секунду ж, это вообще за гранью добра и зла. Больше на монитор температуры похоже, но у меня вроде виджетов таких не стоит, если только сервис какой... но я вроде не ставил ничего нового, а раньше не моргал, потому и удивился.

sptim
() автор топика

Ты уверен, что это тупо не время доступа к файлам постоянно записывается? :-) проверь что в параметрах монтирования указан noatime и nodiratime .

vtVitus ★★★★★
()
Ответ на: комментарий от vtVitus

Нет, relatime у меня везде и commit=60, но это тоже предотвращает.

sptim
() автор топика
Ответ на: комментарий от firkax

Вот с этим соглашусь. А вопрос такой, чтение температуры же - это тоже блочная операция на устройство? Т.е. она тоже должна попадать в статистику, даже если обращается к контроллеру, а не читает/пишет на диск или это уже другой коленкор?

sptim
() автор топика
Ответ на: комментарий от u5er

Вообще, тут логика прямая. Контроллер диска зажигает светодиод в тот момент, когда идёт обмен информацией с диском. Выполнение команды - это тоже обмен информацией. Можешь легко проверить. Загрузи модуль drivetemp, найды в /sys/class/hwmon показометр температуры дисков и дёргай cat’ом её. Индикатор будет мигать в момент дёрганья.

u5er ★★★
()
Ответ на: комментарий от anonymous

Такая же ситуация. Я бы предположил, что это какая-нибудь служба сенсоров считывает состояние дисков для реал-тайм отображения... Тайминг подходящий... Блин, ни виджетов, ни служб никаких не ставил, в обновках тоже ничего такого не прилетало.
Я блин уже и кеш ФФ на темпфс переделал (это я про нагрев диска, думал может он нагружает), но нет.

sptim
() автор топика
Ответ на: комментарий от anonymous

Ну это контроллер, он всегда горячее. Если что, то температура, что отображается в винде например - это как раз температура памяти, и когда говорят о температуре SSD - как раз ее приводят. :)
Но согласен, без жесткой нагрузки такого быть по идее не должно (ну или контроллер если не занимается в простое какой-то своей внутренней самодеятельностью - оптимизирует карту блоков например?).

sptim
() автор топика

Посмотри этими способами. В манах найдешь инфы по больше.

hbars ★★★★★
()
Ответ на: комментарий от sptim

Так, вроде бы нашел, что это было. Но хоть убей не понимаю как так. Добавил виджет системного монитора на панель, добавил туда температуру с датчиков SSD - «мигает без изменений», удалил виджет с панели - «мигает», завершил сеанс - «погас», залогинился... и тишина! Вот это блин пердюмонокль! 8-x

p.s. Всем большое спасибо за советы! :)

sptim
() автор топика
blktrace /dev/XXX  -o - | blkparse -i -

показыват все.

Я пытался понять почему hdd не засыпает, а оказалось, что раз в 5 минут ext4 синкается.

vel ★★★★★
()
Ответ на: комментарий от vel

Ну, это еще по божески - раз в пять минут (но не уснуть, да), у меня jbd2 постоянно что-то в разделы ext4 пишет раз в несколько секунд - журналирование, тут без вариантов, если только извращениями не заниматься. За совет тулзы - отдельное спасибо! Очень подробный вывод - для анализа самое то.

sptim
() автор топика
Последнее исправление: sptim (всего исправлений: 2)
Ответ на: комментарий от targitaj

Журнал, насколько я помню, можно настроить, чтобы срал «партиями», а не «постоянно». :)

sptim
() автор топика
Последнее исправление: sptim (всего исправлений: 1)
Ответ на: комментарий от firkax

Я выше написал, как избавился от этого, да, включаю виджет «системный монитор» с добавлением датчиков температуры SSD - и начинает дергать. Фокус в том, что у меня данный виджет не использовался, но после его включения-отключения - всё стало по феншую, х.з. что это был за затык такой, боюсь, уже и не узнать.

sptim
() автор топика
Ответ на: комментарий от sptim

Ну это контроллер, он всегда горячее. Если что, то температура, что отображается в винде например - это как раз температура памяти, и когда говорят о температуре SSD - как раз ее приводят. :)

У меня 2 SSD, посмотрел sensors, на одном 37С, на другом 40С. 75 в простое это и правда ад какой-то.

Loki13 ★★★★★
()
Ответ на: комментарий от sptim

Скорее всего. iotop у нас же показывает файловый ввод-вывод. Но тут не уверен.

u5er ★★★
()

Переходник моргает судя по всему, а не диск.

fucpsy
()
Ответ на: комментарий от Loki13

Х.з. я не нашел что у него там за внутренняя жизнь. :(
Вот, сейчас дернул sensors - опять горячий, хотя ничего не делаю, к диску обращений нет...

nvme-pci-0500
Adapter: PCI adapter
Composite:    +46.9°C  (low  = -273.1°C, high = +80.8°C)
                       (crit = +80.8°C)
Sensor 1:     +46.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +72.8°C  (low  = -273.1°C, high = +65261.8°C)

nvme-pci-0100
Adapter: PCI adapter
Composite:    +34.9°C  (low  = -273.1°C, high = +80.8°C)
                       (crit = +80.8°C)
Sensor 1:     +34.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +39.9°C  (low  = -273.1°C, high = +65261.8°C)

p.s.
А пока дописал и снова дернул - уже холодный:
nvme-pci-0500
Adapter: PCI adapter
Composite:    +42.9°C  (low  = -273.1°C, high = +80.8°C)
                       (crit = +80.8°C)
Sensor 1:     +42.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +49.9°C  (low  = -273.1°C, high = +65261.8°C)

sptim
() автор топика
Последнее исправление: sptim (всего исправлений: 2)
Ответ на: комментарий от fucpsy

А его можно как-то неправильно подключить? :)

Переходник моргает судя по всему, а не диск.

На нем дубляж hdd-led, это были обращения чтения температуры диска, потому и не было ничего в iotop.

sptim
() автор топика
Ответ на: комментарий от firkax

iotop кривое всё, может чего-то не видеть

ну да, оно может не показать обращения к диску, которые были между опросами iotop'а. что есть под linux, что вообще всё показывает что обращалось к диску?

teod0r ★★★★★
()
Ответ на: комментарий от teod0r

Ну, на это есть режим с аккумуляцией: iotop -a
Про всё - было упоминание выше

sptim
() автор топика

Эта тема поднималась уже много раз. Начиная с какой-то 5.x версии ядра в драйвер дисковой подсистемы был добавлен heartbeat. Т.е. лампочка мигает, даже если IO нет. Да, именно 1 раз за 2 сек. Независимо от железа.

anonymous
()
Ответ на: комментарий от anonymous

Тут не раз в две секунды было, а два раза в секунду.
Но интересно стало и на всякий случай глянул: CONFIG_LEDS_TRIGGER_HEARTBEAT=m, насколько понимаю сборка в модуль?
В загруженных модулях триггеров нет.

sptim
() автор топика
Ответ на: комментарий от sptim

Да, бросьте, ничего интересного.

К heartbeat-у/watchdog-у для компьтера это не имеет отношения. Например, в Armbian для SBC мигает 3-й светодиод как показатель работы с software watchdog, но никак не светодиоды hdd или «копьютер включен».

По большому счёту эта «фича» всем только навредила. Люди начинают искать, в чём проблема с ПО и/или дисками, хотя проблемы нет совсем.

Чаще всего зависания дисковой подсистемы бывают из-за забитости буферов при копировании, когда целевое устройстово вдруг потерялось.

В этом случае, могут залочится и другие дисковые устройства, вплоть до невозможности воспользоваться терминалом: не будут работать самые базовые команды, т.к. «/» недоступен. Админ сразу понимает в чём дело. На лампочку тут смотреть бессмысленно, она может продолжать мигать.

Эта фича в Linux по своей бессмысленности и вреду очень похожа на добавление Wait_IO в показатель LA в 90-х гг. Админитраторы классических Unix в курсах.

А дисковую активность удобно смотреть atop (от root-а). Эта тулза показывает в том числе и scrub для зеркал md / zfs. Ну, и обычные iostat -d 10, zpool iostat -vyl 10.

anonymous
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.