LINUX.ORG.RU

CentOS 6.4 - Fan removed on enclosure


0

1

Доброго времени суток! Случился внезапный отказ вентиляторов продувки дисковой полки. Случился спонтанно посреди рабочего дня. - CentOS release 6.3 (Final) - MB: Supermicro x9scl-f

[root@tor log]# cat /var/log/messages | grep -i fan
May 11 05:17:28 tor kernel: ACPI: Fan [FAN0] (off)
May 11 05:17:28 tor kernel: ACPI: Fan [FAN1] (off)
May 11 05:17:28 tor kernel: ACPI: Fan [FAN2] (off)
May 11 05:17:28 tor kernel: ACPI: Fan [FAN3] (off)
May 11 05:17:28 tor kernel: ACPI: Fan [FAN4] (off)
May 11 05:17:37 tor MR_MONITOR[2124]: <MRMON170> Controller ID:  0   Fan removed on enclosure:   1  Fan#012      1
May 11 05:17:37 tor MR_MONITOR[2124]: <MRMON168> Controller ID:  0   Fan failed on enclosure:   1  Fan#012      1
May 11 05:17:37 tor MR_MONITOR[2124]: <MRMON170> Controller ID:  0   Fan removed on enclosure:   1  Fan#012      2
May 11 05:17:37 tor MR_MONITOR[2124]: <MRMON168> Controller ID:  0   Fan failed on enclosure:   1  Fan#012      2
May 11 05:17:37 tor MR_MONITOR[2124]: <MRMON170> Controller ID:  0   Fan removed on enclosure:   1  Fan#012      3
May 11 05:17:37 tor MR_MONITOR[2124]: <MRMON168> Controller ID:  0   Fan failed on enclosure:   1  Fan#012      3
May 11 05:17:37 tor MR_MONITOR[2124]: <MRMON170> Controller ID:  0   Fan removed on enclosure:   1  Fan#012      1
May 11 05:17:37 tor MR_MONITOR[2124]: <MRMON168> Controller ID:  0   Fan failed on enclosure:   1  Fan#012      1
May 11 05:17:37 tor MR_MONITOR[2124]: <MRMON170> Controller ID:  0   Fan removed on enclosure:   1  Fan#012      2
May 11 05:17:37 tor MR_MONITOR[2124]: <MRMON168> Controller ID:  0   Fan failed on enclosure:   1  Fan#012      2
May 11 05:17:37 tor MR_MONITOR[2124]: <MRMON170> Controller ID:  0   Fan removed on enclosure:   1  Fan#012      3
May 11 05:17:37 tor MR_MONITOR[2124]: <MRMON168> Controller ID:  0   Fan failed on enclosure:   1  Fan#012      3
Как считаете проблема аппаратная или это проблемы с linux acpi? UPDATE: посмотрел состояние вентиляторов через ipmi, показывает что исправны и даже скорость оборотов показывает.



Последнее исправление: keferoff (всего исправлений: 1)

Теория вероятности нам кагбе подсказывает, что все вентиляторы не могут отказать одновременно. Крайне маловероятно. Так что мониторь температуру - если ничего не меняется, то всё ок.

blind_oracle ★★★★★
()
Ответ на: комментарий от blind_oracle

Что значит мониторить температуру? Визуальный осмотр трёх вентиляторов продува дисковой полки показал их полную остановку. Температура дисков в полке близка к критической, зашкаливает за 50 уже. Вывести из эксплуатации сервер дело не самое быстрое.

keferoff
() автор топика
Ответ на: комментарий от keferoff

Ну если остановились, значит абзац. Возможно погорел какой-то контроллер, управляющий ими, или что-то в таком духе. Если это корзина, то там скорее всего они к бэкплейну подключаются, смотри его. Или к плате управления питанием.

blind_oracle ★★★★★
()
Последнее исправление: blind_oracle (всего исправлений: 1)

STOP.

PIPING.

C A T S.

anonymous
()
Ответ на: комментарий от keferoff

т.е. ipmi нагло врет? от ыж ынтырпрайз.

anonymous
()
Ответ на: комментарий от blind_oracle

Шасси Supermicro`вское Supermicro CSE-846BE16- R1K28B 4U Rack, Black, 24x3.5" Hot-swap (SAS / SATA) Drive Bays, 2xPSU http://www.supermicro.com/products/chassis/4u/847/sc847e26-rjbod1.cfm Система продувки от Nidec на хотсвопе, питается от бекплейна. Контролируется от системной платы Supermicro X9SCL-F

keferoff
() автор топика
Ответ на: комментарий от keferoff

Попробуй по одному вытащить и вставить вентиляторы. Не поможет - ищи замену, а пока прибавь кондиционер, поставь напольные вентиляторы что ли. И свяжись с саппортом шасси. Кстати, у нее хоть какой-нибудь интерфейс настройки есть?

cipher ★★★★★
()
Последнее исправление: cipher (всего исправлений: 2)
Ответ на: комментарий от cipher

Кондиционер топит на максимум, полка продувается напольным вентилятором, виртуалки сматываются на резервную схд через storage vmotion. Текущая температура дисков в полке 41-48С. У шасси сапорт стандартный через реселера, реслер в душе не в курсе что произошло. Ну есть ipmi на материнке, но с него толку никакого, говорит вентиляторы все актитвны и даже показывает изменение оборотов дохлых вентиляторов дисковой полки. Я с серверным железом только начинаю знакомится, мне просто вытащть вентиляторы дисковой полки отогнув защёлку? Никаких дополнительных манипуляций не требуется?

keferoff
() автор топика
Ответ на: комментарий от keferoff

Ещё такой момент, а что если мне запитать систему продувки корзины не от бекплейна, а от блока питания напрямую?

keferoff
() автор топика
Ответ на: комментарий от keferoff

Вытащи один, если их можно на горячую дергать, подожди секунд 20, засунь обратно. Скорее всего не поможет, но проверить стоит.

реслер в душе не в курсе что произошло.

Договор поддержки есть? Или они просто продали и забыли?

cipher ★★★★★
()
Последнее исправление: cipher (всего исправлений: 1)
Ответ на: комментарий от cipher

Договор включает обслуживание в офисе реселера, тоесть это надо выводить из эксплуатации и везти к ним в офис, это царский геморой.

keferoff
() автор топика
Ответ на: комментарий от keferoff

В общем то что кулеры питаются от бекплейна я глупость смолол. Питаются они как и управляются, материнской платой. Через три 4 пиновые подключения.

keferoff
() автор топика
Ответ на: комментарий от keferoff

Значит это не та полка, на которую ты ссылку выше давал. Там нет места под мать.

blind_oracle ★★★★★
()
Ответ на: комментарий от keferoff

а нафига к шасси чето левое подключали?

если бекплейн глюканул то он легко может слать на матерь все что угодно

Slackware_user ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.