LINUX.ORG.RU

Kernel Panic


0

1

Имеется сервер на CentOS 5.5, который работает через virtualbox 4.0.4 и на котором работает сервер worldofwarcraft Стабильно раз в 26(+/-4) часа падает в kernel panic: http://rghost.ru/4754906/image.png

Как видим, проблемы какие-то с acpi — галочка на включение ACPI стоит в настройках vbox'а, но даже когда ядро падает, написано, что reboot через 5 секунд, но никакого ребута нет.

Проблема на в vbox, так как на 3 версии аналогичная проблема.

НО, если сервер wow выключен, ничего не падает(по-моему). Сначала собирал его с указанием всех переменных в cmake, затем начал собирать исходники в native — тоже не помогло, что говорит, что дело не в том, как Я его собираю, а в нечто другом.

С этой проблемой боролся полной перестановкой ОС на другую vm, но через неделю и на ней началось тоже самое. Что делать уже не знаю, прошу Вашей помощи.

Попробуй выключить ACPI в VirtualBox'е и в гостевой системе. А вообще, это похоже на какой-то баг VBox'а.

Deleted
()

Напоминает проблему с DSDT. Как вариант, можно попытаться пофиксить в нём ошибки и вкомпилить исправленную DSDT в ядро.
У меня тоже периодически выпадало в kernel_panic на EeePC 1201N из-за интенсивного использования wi-fi. Давеча поправил - пока вроде нормально (тьфу-тьфу-тьфу).
Также, если проблема всё же в DSDT, можно попробовать параметр загрузки acpi=copy_dsdt.

carasin ★★★★★
()
Ответ на: комментарий от carasin

И ещё. Покажите выхлоп lspci -v. Желательно выложить на pastebin.com, а ссылку сюда.

carasin ★★★★★
()
Ответ на: комментарий от guilder

>>я не очень понял какая операционка на какой работает

[root@wowsrv1 ~]# uname -a Linux wowsrv1 2.6.18-194.32.1.el5 #1 SMP Wed Jan 5 17:53:09 EST 2011 i686 athlon i386 GNU/Linux

и и что за сервер вова

Trinitycore

Покажите выхлоп lspci -v

http://pastebin.com/uL0pc95C

acpi=copy_dsdt

Что это значит? Меня бы устроило отключение всего ненужного в том числе и DSDT, если он вообще у меня есть.

CormHolio
() автор топика

Попробуйте загрузиться с vga=6 или ловить логи ядра по эмулируемому последовательному порту.

А ещё я вижу надпись «e1000» - название драйвера сетевой карты. Возможно, проблема в том, что данная версия не справляется с повышенной нагрузкой на сеть.

AITap ★★★★★
()
Ответ на: комментарий от AITap

Что значит сеть не справляется с нагрузкой?

Сетевая карты стоит в гипервизоре Intel PRO/1000 MT Desktop

Нагрузка сети не превышает 1-2 мегабита RX/TX

CormHolio
() автор топика
Ответ на: комментарий от CormHolio

Ночью попробую отключить acpi и посмотреть, будет липадать ядро без него или нет.... Но Я думаю будет, так как оно почему-то не может к нему обратиться, так как пишет, что ребут через 5сек, но так ребута и не происходит......

CormHolio
() автор топика

на модуль e1000 ругается же
попробуйте сменить эмулируемую модель сетевой карты на что-то попроще

у нас весьма нагруженный LAMP вебхостинг вполне стабильно крутится под VirtualBox

frozen_twilight ★★
()
Ответ на: комментарий от CormHolio

Я имел в виду проблему в драйвере.
Попробуйте создать при помощи socat для PTY, соединённых между собой, один пробросьте в виртуальную машину (и заставьте ядро использовать его в качестве консоли), а другой читайте - там будет полное сообщение об ошибке, а не его кусок, видимый на «экране».

AITap ★★★★★
()
Ответ на: комментарий от frozen_twilight

Благодарю.

Значит попробую отключить acpi и сменить сетевую карту в гипервизоре на более простую.

CormHolio
() автор топика
Ответ на: комментарий от CormHolio

Первая же ссылка по запросу acpi=copy_dsdt в Google выдаёт такое (можно даже по ссылке не переходить):

Google

ACPI: add boot option acpi=copy_dsdt to fix corrupt DSDT

А вот насчёт lspci -v - это я погорячился, ибо забыл, что система в виртуалке. Просто на некоторых сетевых картах неудовлетворительно работает обработка IRQ (не знаю, как по-другому это назвать), и воркэраундом этому служит добавление в строку загрузки параметра «pci=nomsi».
Просто мне кажется, что дело именно в работе сетевого устройства при повышении трафика.

carasin ★★★★★
()
Ответ на: комментарий от carasin

Поставил acpi=copy_dsdt

Изменить сетевую карту на более «простую» не удалось. С обычными PCI-Fast не хочет работать, точнее не работает сеть, а разбираться почему не может увидеть «простые» сетевые карты разбираться некогда, так как может получиться большой простой, а это просто не допустимо.

Выбрал другую сетевую карты из той же 1000 серии. Что будет не знаю, но надеюсь, что всё будет замечательно и работать, так как «заставлять» сервер делать ребут раз в сутки этот как-то уж слишком......

CormHolio
() автор топика
Ответ на: комментарий от CormHolio

точнее не работает сеть

Новая железка - новый сетевой интерфейс, его просто надо настроить. Возьмите настройки 1-в-1 от того, что был. :)

frozen_twilight ★★
()
Ответ на: комментарий от CormHolio

Обновления на CentOS, кстати, пробовали накатывать? VirtualBox Additions стоит?

frozen_twilight ★★
()
Ответ на: комментарий от CormHolio

Ну, теперь как погоняете свой сервер - отпишИтесь, что и как. Даже интересно стало, неужели проблема с этими низкоуровневыми «вещами» распространены в GNU/Linux более, чем у меня одного =)

carasin ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.