LINUX.ORG.RU
ФорумAdmin

Linux cluster + acpi(pm-suspend)


0

1

Есть задача: Сбор стат. данных показаетелей кластера(нагрузка на nodes,температура, параметры фс, idle, etc). Создание системы энергосбережения, на основе собираемых данных.

Дело в том что задача наполовину учебная(те желательно сделать логику самому). А доступа к кластеру пока нет, универ ещё не расшарил.

Есть идеи по реализации но не хватает опыта((.Нужен совет. Идея такая:

Инфа будет хранится в RRD. Данные берём из snmp MIB. Создаём процесс(скрипт на perl) который собирает инфу и обновляет rrd, рисует графики для web-интрефейса. Этот же скрипт должен доставать часть данных из rrd анализировать их, например по idle и принимать решение перевести узел в ждущий режим.

На локалке(на хоумпс) скрипт работает отлично.какие могут быть проблемы при переносе на кластер?

Точнее как отлично..Засыпает хорошо. Но как будет просыпаться... На локалке это сделать трудно, на кластере планирую через wake-on-lan.

Прокоментируйте пожалуйста, что я не учёл. Не хочется уронить казёное оборудование)И до запуска хочу учесть все мелочи..

п.с. следующие проблеммы кажутся наиболее вероятными: ACPI и кластер, проблемы с синхронизацией, и вообще как то мало инфы по этому поводу.. Если кто подкинет, буду очень благодарен. Как на кластере реализовать pm-suspend конкретного nod'а как их потом разбудить) - это основная проблемма. доступ к mib по конкретному nod'у. те необходимо ли поключение по локалке, или доступ можно получить с основной машины..


На кластере работает какая то очередь... на каждом свои забубоны... у очереди полная информация о загрузке. Вот софт очереди и хачить надо.

выключать --- суспенд то мемори делать? включать ваке-он-лан наверное? монтировать --- размонтировать что то там если есть что.

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

Инфа с очереди пригодится. И проблем чтоб её достать тоже не будет.

я немного не понял конец поста.. если вэйк он лан то по какому сигналу? Или пустить ещё один процесс, который при новом соединении пробегается по нодам и будит?

я так понимаю primary-node имеет root доступ ко всем nodes. И можно так: system(«bash -c 'ssh root2@192.168.1.24'»); system(«bash -c 'pm-suspend»);

а потом по всем нодам: system(«bash -c 'wakeonlan 00:00:00:00:00»);

монтировать --- размонтировать что то там если есть что.

а разве разве они автоматом не смонтируются при переходе из ждущего режима?

kondr
() автор топика
Ответ на: комментарий от kondr

...ну как в очередь попала задача задействующая больше узлов чем сейчас есть бодрствующих свободных, то «всех будить», потом не задействованное суспендить.

psv1967 ★★★★★
()
Ответ на: комментарий от psv1967

Там не так просто.. Обычно пользователь заходит, проверяет свободное кол-во узлов, и на них запускает расчёты.Но если их будет больше, встанет в очередь..Но тут как бы не факт что введённое им число = число свободных+ число ждущих. неразбериха получается..((

Ещё один вопрос к знатокам) Реально собрать кластер из компов разной структуры?pentium 1,core 2 duo, phenoь 2 x4?чисто для тестов..? насколько я знаю нужно чтоб встала пара пакетов..и всё?

anonymous
()
Ответ на: комментарий от anonymous

Я и говорю что хачить надо сам софт очереди, чтобы показывало число доступных узлов с учётом спящих и будило их по факту заказа прозрачно для пользователя.

psv1967 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.