LINUX.ORG.RU

Был тихий вечер...


0

1

Был тихий вечер. Мерно и уверенно крутились жесткие диски и несколько визгливо кулеры на процессорах серверов.
Их было много, и дежурный не услышал, как один из кулеров на процессоре i3 совершил несколько последних в своей жизни оборотов и беззвучно заклинил.
Ситуация обнаружилась при просмотре Мюнина лишь тогда, когда на графике был обнаружен огромный всплеск температоры процессора и спад до нуля - сервер выключился.

Злочастный кулер был заменен и все снова пришло в норму.
Но стало интересно - как отреагировал Linux на столь фатальную ситуацию?
Оказалось, бездарно, т.е. - никак. Т.е. процессор в логах отчаянно сообщал всякие душеразирающие ахтунги, но Linux вместе со своим знаменитым ядром от не менее знаменитого создателя ложил на них болт.
Хотя, рассуждая здраво, они должны были тихо и планомерно «потушить» ОС и выключить компьютер.
Но этого не случилось. Процессор в последний раз выдал нечто из ряда вон выходящее, а блок питания, видимо, благодаря сигналу от BIOS, тупо вырубил подведомственное ему питание сервера.
В результате система с разгону шлепнулась в лужу, подпортив файловую систему, которую потом пришлось принудительно чекать.

А теперь вопрос: неужели в самом деле Linux 3-го тысячелетия по-прежнему настолько туп, что не в состоянии самостоятельно и грамотно реагировать на столь понятную ситуацию - фатальное превышение темепературы процессора?

★★★★★

А ты заранее настроил ОС, чтобы она гасилась в такой ситуации? И вот скажи, причем здесь ядро?

И по большому счету, шутдаун в такой ситуации не успеет закончиться до расплавления кристалла.

ansky ★★★★★
()
Ответ на: комментарий от ansky

Хм, при чем тут «настроил»? При такой фатальной ситуации, понятной даже лошадям, ядро должно само понимать и шутдаунить ОС - тут не до реверансов.
Ведь процессор посылает ему сигналы, это видно по логам, почему же ядро не реагирует и не «тушит» систему, а только логи выдает?
И именно ядро должно этим заниматься, а не админ, иначе на кой фиг для него выпускают патчи под различные семейства процессоров.

Что до времени - очень даже успевает: по Мюнину видно, что процесс длился несколько минут.

chukcha ★★★★★
() автор топика
Ответ на: комментарий от chukcha

Вас в админы короновали или еще нет?

anonymous
()
Ответ на: комментарий от chukcha

А что бы сделала венда? Линукс хотя бы троттлинг при перегреве включает, но с мёртвым куллером практически любой процессор расплавится за секунды всё-равно, ну хотя в них заложено отключение при ±90℃. Наверное можно подкрутить, чтобы ядро роняло частоту процессора до минимума, но тогда точно не успеет завершиться. Алсо, температура, при которой включается троттлинг, бывает вполне штатной - сразу гасить?

wakuwaku ★★★★
()
Ответ на: комментарий от wakuwaku

с мёртвым куллером практически любой процессор расплавится за секунды

Ты пробовал? Прямо так и расплавится? Сильно сомневаюсь, особенно сомневаюсь что любой и что за секунды.

mbivanyuk ★★★★★
()

но Linux вместе со своим знаменитым ядром

Почему никто не послал этого неуча на читать матчасть?

Хотя, рассуждая здраво, они должны были тихо и планомерно «потушить» ОС и выключить компьютер

Рассуждая здраво, так не делает даже маздайка, возможно, по причине существования стресс-тестов.

Valkeru ★★★★
()
Последнее исправление: Valkeru (всего исправлений: 2)
Ответ на: комментарий от chukcha

Ведь процессор посылает ему сигналы, это видно по логам, почему же ядро не реагирует и не «тушит» систему, а только логи выдает?

по логам посылает сигналы sensorsd, а не ядро.

ядро вообще ничего не знает о таком понятии как датчик температуры.

dikiy ★★☆☆☆
()
Ответ на: комментарий от wakuwaku

но с мёртвым куллером практически любой процессор расплавится за секунды всё-равно

Проиграл. Я пол дня сидел с отключенным кулером, потому что забыл выкрутить реобас, и он.. и он просто выключился.

Хотя если у вас amd может успеете ещё и гренки приготовить..

ritsufag ★★★★★
()

неужели в самом деле Linux 3-го тысячелетия по-прежнему настолько туп, что не в состоянии самостоятельно и грамотно реагировать на столь понятную ситуацию - фатальное превышение темепературы процессора?

В такой ситуации должен срабатывать аппаратный датчик выключающий железку аппаратно. Что бы не зависеть от ОС.

MikeDM ★★★★★
()
Ответ на: комментарий от dikiy

ядро вообще ничего не знает о таком понятии как датчик температуры.

Смотря какое ядро. Про опен смотри выше.

beastie ★★★★★
()
Ответ на: комментарий от anonymous

Да. На одной железке это меня даже иногда бесит. Там глючный acpi, рапортующий иногда после warm-boot >4000 °C. Так Open не моргая газом отправляет железку в shutdown. ;) Причём занимается эти именно ядро, без всяких надстроек, которые, впрочем тоже есть.

UPD: Сензорную подсистему для Open писал кстати один из лоровцев. → Новый программный интерфейс датчиков в OpenBSD

beastie ★★★★★
()
Последнее исправление: beastie (всего исправлений: 2)
Ответ на: комментарий от wakuwaku

с мёртвым куллером практически любой процессор расплавится за секунды

Неа, проверял на PIV. Отрубается и все. Проц жив, работает до сих пор.

yirk ★★★
()
Ответ на: комментарий от beastie

UPD: Сензорную подсистему для Open писал кстати один из лоровцев.

энтерпрайзненько.

splinter ★★★★★
()
Ответ на: комментарий от wakuwaku

с мёртвым куллером практически любой процессор расплавится за секунды всё-равно,


И превратится в стекло. У меня амд крепления сокета расплавил, с новым кулером работает дальше.

По теме - напишите скрипт, который снимает показания сенсоров и отключает систему. Хотя скорее всего что то подобное уже есть

MyFreedom ★★★
()
Ответ на: комментарий от beastie

В линуксе был, а может и сейчас есть, модуль thermal, который читает acpi, работает далеко не со всеми материнками, но гасить систему умеет, не случайно у него есть параметр ″nocrt=1″ для работы на глючных материнках.

mky ★★★★★
()
Ответ на: комментарий от ritsufag

Ну, возможно. Для максимального эффекта надо ещё забыть намазать термопасту, а дальше всё зависит от эффективности радиатора. И живучести камня, мой старый п4-3000 в своё время тоже пережил несколько таких приключений, в итоге это немножко сказалось на его здоровье.

wakuwaku ★★★★
()

Без нормального охлаждения большинство процессоров разогревается до 100 °C очень быстро, и времени на выключение остаётся крайне мало.

Programmist11180 ★★★
()
Ответ на: комментарий от ritsufag

Хотя если у вас amd может успеете ещё и гренки приготовить..

у меня sempron 145й, причём разогнан, во всём корпусе один единственный вентилятор в БП - всё отлично

lazyklimm ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.