LINUX.ORG.RU
ФорумAdmin

Непонятка с ядром...

 ,


0

1

Кратко:
- серверное железо древних лет(>10).
- 4 hdd(3 * raid5mdadm +1 spare)
- ядро версии 6.13 и ниже - всё ок...
- накатываю ядра 6.17,6.18 - проблема.
Выглядит загрузка следующим образом:
- старт grub - ok
- загрузка ядра + initramfs - ок, сообщения ядра без проблем вижу.
- старт загрузочных скриптов с initramfs - фиг вам, ни одного сообщения.

Графического режима или там quiet - не стоит. Паники - тоже нет.
Ждал минут 15 - без изменений.
Сравнивал ".config" от ядер - ничего подозрительного,только новые устройства в основном отключенные. Отрубил защиту от процессорных уязвимостей - без результата. Посмотрел краткие изменения в выпуске ядер - вроде ничего по отношению к block devices не анонсировалось.

Если смотреть в момент загрузки на активность жестких дисков - то явно видно в первые секунды все 4, потом только диски что уже участвуют в raid секунд 40 активно синхронно мигают и после редко .

Пробовал поставит параметр loglevel=3 или loglevel=7 - ни чего интересного.
Думал может где то библиотека забыта для программ initramfs - посмотрел, все ок.

Попробую ещё запустить ядро в qemu.
Что ещё может подскажите?
P.S. netconsole - пока не хочу городить, да и думаю смысла нету.

★★★★★
Ответ на: комментарий от splinter

да, и активно винты общаются

в первые секунды все 4, потом только диски что уже участвуют в raid секунд 40 активно синхронно мигают и после редко .

Atlant ★★★★★
() автор топика
Последнее исправление: Atlant (всего исправлений: 1)

старт загрузочных скриптов с initramfs - фиг вам, ни одного сообщения

А может собака там зарыта? В инитрамфс? Если у тебя всё собирается из сорцов и не используется шифрование диска, то всё вкомпиль в ядро и собери его без модулей и пробуй запустить без инитрамфс.

u5er ★★★
()
Последнее исправление: u5er (всего исправлений: 1)
Ответ на: комментарий от splinter
-rw-------.  1 root root 38068884 дек  5 16:19 initramfs-6.18.0-20251205.img
-rw-------.  1 root root 10544128 дек  5 17:20 vmlinuz-6.18.0-20251205


Добрался таки до сервера.

Atlant ★★★★★
() автор топика
Последнее исправление: Atlant (всего исправлений: 1)
Ответ на: комментарий от Atlant

сравни /init в загружаемом initramfs и твоём или что ты там указываешь в качестве первичного сценария инициализации?

splinter ★★★★★
()
Последнее исправление: splinter (всего исправлений: 1)
Ответ на: комментарий от Atlant

Может тут какая зараза порылась. В старом ещё не было spare диска

diff -Nudr initramfs-6.13.4-20250227/etc/mdadm.conf initramfs-6.18.0-20251205/etc/mdadm.conf
--- initramfs-6.13.4-20250227/etc/mdadm.conf    2019-12-17 13:08:43.000000000 +0000
+++ initramfs-6.18.0-20251205/etc/mdadm.conf    2025-12-05 16:01:08.000000000 +0000
@@ -1,4 +1,4 @@
-ARRAY /dev/md/0 metadata=1.2 UUID=e1553f13:b15725d8:136449d6:db1d0cd0
-ARRAY /dev/md/1 metadata=1.2 UUID=057be2e3:01610a81:cd35397b:44b1d0ab
-ARRAY /dev/md/2 metadata=1.2 UUID=9d3268c2:3c217531:08dc7ba0:d65becf3
-ARRAY /dev/md/3 metadata=1.2 UUID=214b8594:44c31789:59f4cdb2:12c89827
+ARRAY /dev/md/0 level=raid5 num-devices=3 metadata=1.2 spares=1 UUID=e1553f13:b15725d8:136449d6:db1d0cd0
+ARRAY /dev/md/1 level=raid5 num-devices=3 metadata=1.2 spares=1 UUID=057be2e3:01610a81:cd35397b:44b1d0ab
+ARRAY /dev/md/2 level=raid5 num-devices=3 metadata=1.2 spares=1 UUID=9d3268c2:3c217531:08dc7ba0:d65becf3
+ARRAY /dev/md/3 level=raid5 num-devices=3 metadata=1.2 spares=1 UUID=214b8594:44c31789:59f4cdb2:12c89827


А не, вру был spare. Это я уже новый конфиг после начала проблем сооружал.

Atlant ★★★★★
() автор топика
Последнее исправление: Atlant (всего исправлений: 1)

Собери пустой initramfs в котором только «echo ok» и бесконечный цикл, опробуй его на обоих ядрах. Дальше три варианта:

1) нигде не работает - чини чтобы хотя бы на старом запустилось

2) работает только на старом - пробуй ядра 6.14 и 6.16 а потом выявляй коммит, начиная с которого сломалось

3) работает на обоих ядрах - плавно превращай этот initramfs в тот который не работает и смотри где сломается

Ну и ещё можно старый initramfs с новым ядром попробовать (всмысле просто тупо их так прописать в grub, модули очевидно не подойдут но, если он работает, хоть что-то же должен написать).

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 1)

Если есть ssh - проверь при загрузке нового ядра, можешь ли подключиться.

Думаю, что проблема не в initramfs / initrd, а в том, что ядро выводит изображение на другой видео выход или его вообще нет в новом ядре.

kostik87 ★★★★★
()
Ответ на: комментарий от kostik87

там нету простого ssh(multiple vlan).
Сообщения ядра я вижу, не вижу сообщений от начального загрузчика.
И да в продолжении - запустил ядро и initramfs в qemu(без дисков) - спокойно дошло до момента отыскания корня и запустило «recovery console». И старая версия ядра и новая - одинаково

Очень похоже на какая то особенность дисками raid5+spare.
Сейчас убрал spare - под вечер попробую перезагрузить.

Atlant ★★★★★
() автор топика
Ответ на: комментарий от kostik87

сделать все можно, но в данном случае до ssh там даже не доходит. Т.е. не требуется менять настройки свитчей или ещё один комп сеть_в_сеть подключать .
Буду пробовать так же отключить автосборку раида и поставлю левый UUID - пусть в shell выкидывает.

Atlant ★★★★★
() автор топика
Ответ на: комментарий от Pinkbyte
00:00.0 Host bridge: Intel Corporation Xeon E3-1200 v2/Ivy Bridge DRAM Controller (rev 09)
	Subsystem: ASUSTeK Computer Inc. Xeon E3-1200 v2/Ivy Bridge DRAM Controller
	Kernel driver in use: ie31200_edac
00:01.0 PCI bridge: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port (rev 09)
	Subsystem: ASUSTeK Computer Inc. Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port
	Kernel driver in use: pcieport
00:01.1 PCI bridge: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port (rev 09)
	Subsystem: ASUSTeK Computer Inc. Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port
	Kernel driver in use: pcieport
00:06.0 PCI bridge: Intel Corporation Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port (rev 09)
	Subsystem: ASUSTeK Computer Inc. Xeon E3-1200 v2/3rd Gen Core processor PCI Express Root Port
	Kernel driver in use: pcieport
00:1a.0 USB controller: Intel Corporation 6 Series/C200 Series Chipset Family USB Enhanced Host Controller #2 (rev 05)
	Subsystem: ASUSTeK Computer Inc. 6 Series/C200 Series Chipset Family USB Enhanced Host Controller
	Kernel driver in use: ehci-pci
	Kernel modules: ehci_pci
00:1c.0 PCI bridge: Intel Corporation 6 Series/C200 Series Chipset Family PCI Express Root Port 1 (rev b5)
	Subsystem: ASUSTeK Computer Inc. 6 Series/C200 Series Chipset Family PCI Express Root Port 1
	Kernel driver in use: pcieport
00:1c.4 PCI bridge: Intel Corporation 6 Series/C200 Series Chipset Family PCI Express Root Port 5 (rev b5)
	Subsystem: ASUSTeK Computer Inc. 6 Series/C200 Series Chipset Family PCI Express Root Port 5
	Kernel driver in use: pcieport
00:1c.5 PCI bridge: Intel Corporation 6 Series/C200 Series Chipset Family PCI Express Root Port 6 (rev b5)
	Subsystem: ASUSTeK Computer Inc. 6 Series/C200 Series Chipset Family PCI Express Root Port 6
	Kernel driver in use: pcieport
00:1c.6 PCI bridge: Intel Corporation 6 Series/C200 Series Chipset Family PCI Express Root Port 7 (rev b5)
	Subsystem: ASUSTeK Computer Inc. 6 Series/C200 Series Chipset Family PCI Express Root Port 7
	Kernel driver in use: pcieport
00:1c.7 PCI bridge: Intel Corporation 6 Series/C200 Series Chipset Family PCI Express Root Port 8 (rev b5)
	Subsystem: ASUSTeK Computer Inc. 6 Series/C200 Series Chipset Family PCI Express Root Port 8
	Kernel driver in use: pcieport
00:1d.0 USB controller: Intel Corporation 6 Series/C200 Series Chipset Family USB Enhanced Host Controller #1 (rev 05)
	Subsystem: ASUSTeK Computer Inc. 6 Series/C200 Series Chipset Family USB Enhanced Host Controller
	Kernel driver in use: ehci-pci
	Kernel modules: ehci_pci
00:1e.0 PCI bridge: Intel Corporation 82801 PCI Bridge (rev a5)
	Subsystem: ASUSTeK Computer Inc. 82801 PCI Bridge
00:1f.0 ISA bridge: Intel Corporation C204 Chipset LPC Controller (rev 05)
	Subsystem: ASUSTeK Computer Inc. C204 Chipset LPC Controller
	Kernel driver in use: lpc_ich
	Kernel modules: lpc_ich
00:1f.2 SATA controller: Intel Corporation 6 Series/C200 Series Chipset Family 6 port Desktop SATA AHCI Controller (rev 05)
	Subsystem: ASUSTeK Computer Inc. 6 Series/C200 Series Chipset Family 6 port Desktop SATA AHCI Controller
	Kernel driver in use: ahci
00:1f.3 SMBus: Intel Corporation 6 Series/C200 Series Chipset Family SMBus Controller (rev 05)
	Subsystem: ASUSTeK Computer Inc. 6 Series/C200 Series Chipset Family SMBus Controller
	Kernel driver in use: i801_smbus
	Kernel modules: i2c_i801
05:00.0 Ethernet controller: Intel Corporation 82574L Gigabit Network Connection
	Subsystem: ASUSTeK Computer Inc. Motherboard
	Kernel driver in use: e1000e
06:00.0 Ethernet controller: Intel Corporation 82574L Gigabit Network Connection
	Subsystem: ASUSTeK Computer Inc. Motherboard
	Kernel driver in use: e1000e
07:00.0 Ethernet controller: Intel Corporation 82574L Gigabit Network Connection
	Subsystem: ASUSTeK Computer Inc. Motherboard
	Kernel driver in use: e1000e
08:00.0 Ethernet controller: Intel Corporation 82574L Gigabit Network Connection
	Subsystem: ASUSTeK Computer Inc. Motherboard
	Kernel driver in use: e1000e
09:05.0 VGA compatible controller: ASPEED Technology, Inc. ASPEED Graphics Family (rev 10)
	Subsystem: ASUSTeK Computer Inc. ASPEED Graphics Family
	Kernel driver in use: ast
Atlant ★★★★★
() автор топика
Ответ на: комментарий от Pinkbyte

к сожалению - да. Остальной софт пока не обновлял.
И эх.. хотел малой кровью обойтись. Придется все обновлять. Там древний dovecot стоял, не хотел заново его конфигурацию шерстить.
Но всё же такое ощущение что это не от mdadm...
P.S. Какие сейчас live(cd/usb) с новым ядром(6.17,6.18) то бы проверить?
Хоть самому сооружай на основе текущего среза gentoo

Atlant ★★★★★
() автор топика
Последнее исправление: Atlant (всего исправлений: 1)
Ответ на: комментарий от router

Имеешь в виду черный экран? modeset, вот это всё

нет.
1. начальная инициация ядра(загрузка ядра и initramfs через grub. (u)efi - нету)
2. сообщения ядра, последнее что пишет
или "... T1] Trying to unpack rootfs image as initramfs.."
или "... T1] Key type blacklist registered"
или ".... T1[ ipmi_si dmi-ipmi-si.0: Remove SMBIOS-specified kcs stat..."
Поскольку проверял несколько вариаций(отключал то что было последним в логах,типа IPMI и поддержку подписей модулей)
Далее только индикация на жестких дисках мигает.

Atlant ★★★★★
() автор топика