LINUX.ORG.RU
ФорумAdmin

systemd[1]: Received SIGINT.

 ,


0

2

Доброго времени, коллеги!

На нескольких машинах происходят спонтанные отключения системы.

Некоторые уходят на перезагрузку, некоторые просто выключаются.

Все машины на Altlinux 10 workstation, kernel: 5.10.82-std-def-alt1

Найдено одно общее сообщение в журналах: systemd[1]: Received SIGINT.

До этого сообщения - нормальная работа системы. После него - нормальный процесс отключения/перезагрузки системы.

Самое неприятное, что подобные случаи отключения/перезагрузки совершенно спонтанны. Машина может неделю или больше работать, а может и по несколько раз за день падать.

При этом загрузка памяти и процессора на падения не влияют.

Все машины работают без подключения к сети, без бесперебойников. Даже кнопок power и reset на них нет.

Машин много, но «болеют» такими непонятными падениями лишь несколько.

Вполне возможен какой-то косяк в оборудовании.

Очень хотелось бы понять, что и по какой причине генерирует этот SIGINT.


Ответ на: комментарий от legolegs

Не проверял, но существует вариант, что в ядре включено ACPI_TINY_POWER_BUTTON, тогда при нажатии будет SIGINT или SIGRTMIN+4. И, вроде, никакого printk() не будет, и события acpid не получит.

mky ★★★★★
()
Ответ на: комментарий от anc

Ну, кнопку подержать несколько секнуд. Но сразу после нажатия в лог пойдёт запись о acpi событии, от acpid(его скрипта) или от systemd-logind. И в лог запишется и сохранится, логи обычно с sync() пишут. Вот на XFS, ЕМНИП, были проблемы, что если файл был открыт в момент отключения питания, то его содержимое теряется. Поэтому про XFS предыдущий пост и написал.

То есть на нормальных ФС логи будут подрезаны, но запись про нажатие кнопки останется и она должна быть до «systemd[1]: Received SIGINT.» Хотя, даже не так, на современных systemd, где события ловит systemd-logind, сигнала SIGINT и не отправляется...

Ну, и «урезанные логи» не факт. Там же 4 секунды нужно кнопку держать, а современные рабочие станции секунды за 2-3 выключаются.

Reset режет не оставляя следов.

Совсем не оставляя следов, а ТС про SIGINT всё пишется.

mky ★★★★★
()
Ответ на: комментарий от mky

Ну, кнопку подержать несколько секнуд.

...

Совсем не оставляя следов, а ТС про SIGINT всё пишется.

Уговорили, сначала power, а потом reset. :)

anc ★★★★★
()
Последнее исправление: anc (всего исправлений: 1)
Ответ на: комментарий от legolegs

Ну, так меня надо бы проверить, я код модуля по диагонали просмотрел. А компилять ядро, загружать модуль, смотреть что в dmesg после загрузки модуля, что после нажатия кнопки совершенно нет времени. Может там всё хорошо, и «tiny-power-button» пишет в dmesg и то, что он загружен и забирает acpi-событие на себя и про нажатие кнопки пишет.

А если нет, и в dmesg тишита, то не от злости, а от минимализма. Минимум кода, максимально просто, зачем линший printk() :) Не нравится — не подключай этот модуль.

Плюся я не уверен, что в Altlinux могли додуматься его засунуть в workstation. Просто написл про ещё один вариант, от чего в современном (ядро >5.7) линуксе может приходить SIGINI процессу 1.

mky ★★★★★
()