high availability, oVirt

0

3

Приветствую.

Ситуация вот какая: есть три (на данный момент) сервера (node01, node02, node03). Есть дисковая полка. Есть 10Gb. oVirt развернут вот так:

node01 - ovirt-engine, vdsm. Собственно тут и вебморда oVirt'a

node02 - vdsm

node03 - vdsm

То-есть, при падении node02 или node03 мигрирую машина на живую ноду и все путем. Но при падении node01 возникает проблема :-) Мигрировать нечем.

Интересна была бы следующая схема:

node01 - ovirt-engine, vdsm. Собственно тут и вебморда oVirt'a

node02 - ovirt-engine, vdsm. Собственно тут и вебморда oVirt'a

node03 - ovirt-engine, vdsm. Собственно тут и вебморда oVirt'a

Реплицируем postgresql, конфиги oVirt с node01 на остальные. Но это геморройная схема.

Как здесь можно реализовать HA чтобы при падении любой из нод можно было обратиться на вебморду oVirta? Кто-нибудь реализовывал такую схему? heartbeat? pacemaker? Может просто mdadm+NFS? И да, количество нод будет расти.

Ссылка

←	DRBD настройка: Need access to UpToDate data

postfix + yandex(Почта для домена) - заголовок from

→

Ну судя по этому и первым мыслям, необходимо саму систему управления дублировать. Но уже не используя oVitr, а с использованием pacemaker, к примеру. Ну это как-то... городить еще один HA на других технологиях, для системы, которая так же управляет HA.

upd.: Я не знаком с обсуждаемым софтом, возможно если дождаться пользователей oVirt можно будет услышать дельные советы. А за темой послежу...

upd2.: Ну вот как я и думал, увиденные мной проблемы очевидны, читать отсюда.

42. «Новая версия системы управления инфраструктурой виртуализаци...»

petav ★★★★★
(30.08.13 16:06:04 MSK)
Последнее исправление: petav 30.08.13 16:07:44 MSK (всего исправлений: 2)

Ответ на: комментарий от petav 30.08.13 16:06:04 MSK

Ну так-то да, НА поверх НА :-)

fashka ★
(30.08.13 16:56:45 MSK) автор топика

Ответ на: комментарий от fashka 30.08.13 16:56:45 MSK

Ну так-то да, НА поверх НА :-)

not production

petav ★★★★★
(30.08.13 23:00:31 MSK)

Коллеги, не работал с oVirt, но я бы решил проблему методом установки самого oVirt в виртуалке. Т.к. сторадж один - то при падении физического node01, на котором крутится виртуалка с oVirt - заходим на node02 и руками запускаем машинку с oVirt. Не? Можно и скрипт для перезапуска прибамбахать, но это отдельная тема.

aeX1pu2b ★
(31.08.13 08:02:22 MSK)

Ссылка

пока те кто не знают, но мнение имеют, брызжут слюнями, люди работают: http://www.ovirt.org/Features/Self_Hosted_Engine

более простой подход, без автоматизации - держать еще одну шару NFS или LUN на котором сидит VM с engine, и запускать руками при падении хоста. либвирт на хостах ovirt можно и руками гонять.

при падении engine, хосты и виртуалки на них продолжают работать, так что не отработает только HA для ВМ упавших вместе с хостом. поднимаем engine и все раскочегарится само по себе.

ну и еще насчет «not production»: ovirt - разрабатывается как офигенно масштабируемая система, на данный момент официально заявлена поддежка до 200 хостов в одном кластере, и это просто потому что больше хостов не нашлось, у тестировщиков. при таком раскладе, две простеньких машинке в кластере - фигня. напомню - кластер это только часть ДЦ, и их может быть не одна сотня.

короче те кто говорит not production скорее всего просто никогда не видели ничего крупнее, и вряд ли увидят. А те кто понимает, спокойно используют ovirt/rhev уже не один год

dyasny ★★★★★
(31.08.13 08:20:17 MSK)

Ответ на: комментарий от dyasny 31.08.13 08:20:17 MSK

А те кто понимает, спокойно используют ovirt/rhev уже не один год

Я так понял, вы используете oVirt в продакшене - скажите, а насколько там реализованы НА (имею ввиду не живую миграцию, а автоперезапуск при падении физ хоста), DRS?

P.S. подбираю замену vmware sphere для дальнейшего развития ДЦ ...

aeX1pu2b ★
(31.08.13 08:35:08 MSK)

Ответ на: комментарий от aeX1pu2b 31.08.13 08:35:08 MSK

в продакшене я использую RHEV. но не суть, HA реализован с первых версий - если хост падает, он получает фенс, и ВМ перезапускаются на других хостах. DRS там нет, его вообще нигде нет кроме vmware. в овирт есть load balancing и квоты, которые можно настраивать. если хост загружен сильнее чем выставлено в политике балансировки кластера, самая «легкая» ВМ на нем переносится на другой хост, и так пока процент нагрузки не упадет ниже заданной границы.

dyasny ★★★★★
(31.08.13 08:54:48 MSK)

Ответ на: комментарий от dyasny 31.08.13 08:54:48 MSK

Пасиба, пошел курить маны, поднимать тестовый oVirt.

RHEV, кроме стабильности, сильно отличается от oVirt? И смогу ли я без особых плясок с бубном в дальнейшем перейти на RHEV?

aeX1pu2b ★
(31.08.13 09:37:11 MSK)

Ответ на: комментарий от dyasny 31.08.13 08:20:17 MSK

Желаю дальнейших успехов

petav ★★★★★
(31.08.13 09:41:14 MSK)

Ссылка

Ответ на: комментарий от petav 30.08.13 23:00:31 MSK

Тебе такой продакшн и не снился даже. Сходи, почитай про гео-кластер что-ли.

anonymous
(31.08.13 13:57:44 MSK)

Ответ на: комментарий от anonymous 31.08.13 13:57:44 MSK

Благодарю за заботу!

petav ★★★★★
(31.08.13 14:44:44 MSK)

Ответ на: комментарий от dyasny 31.08.13 08:20:17 MSK

В RHEV 3.3 обещают http://rhsummit.files.wordpress.com/2013/06/cathrow_thu_450_rhev.pdf

'Hosted Engine' – self hosting RHEV-M as highly available VM

anton_jugatsu ★★★★
(31.08.13 15:16:24 MSK)

Ответ на: комментарий от aeX1pu2b 31.08.13 09:37:11 MSK

отличия обычно в фичерах - RHEV всегда немного позади, туда не попадают необкатанные, сырые фичи.

Кроме того, так как RHEV ставится в подконтрольный разработчикам дистр, установка и рутинная работа обычно очень просты и сюрприсов не приносят. с установкой овирт зачастую приходится помучиться потому что федора и даже центос - не RHEL и конфликты с другим софтом могут иметь место

переход, насколько я знаю, не запланирован в штатном порядке. То есть можно экспортировать все ВМ на NFS хранилку, и импортировать в RHEV, но это долго и даунтайм будет изрядный, в зависимости от размеров ВМ

dyasny ★★★★★
(01.09.13 08:33:14 MSK)

Ссылка

Ответ на: комментарий от anton_jugatsu 31.08.13 15:16:24 MSK

молодцы, не бросили мой проект, продолжают толкать :)

dyasny ★★★★★
(01.09.13 08:34:49 MSK)

Ссылка

Ответ на: комментарий от petav 31.08.13 14:44:44 MSK

ну вот, сначала напишешь чушь под видом эксперта, а потом обижаешься, когда укажут что это не так. и не первый раз ведь ересь несешь.

anonymous
(01.09.13 12:46:47 MSK)

Ответ на: комментарий от anonymous 01.09.13 12:46:47 MSK

С кем честь имею?

petav ★★★★★
(01.09.13 17:37:43 MSK)

Ссылка

Тему придумал: на нодах поднять glusterfs, вынести на неё базу postgresql. Так же на нодах поставить engine-ovirt и выполнить первоначальную инициализацию (engine-setup). Ну и все storage для Datacenter'а вынести на полку.

--- Что скажете?

fashka ★
(03.09.13 08:35:18 MSK) автор топика

Ответ на: комментарий от fashka 03.09.13 08:35:18 MSK

--- Что скажете?

Как то сложно это, что мешает engine-ovirt с постгре поставить прямо на виртуалке?

aeX1pu2b ★
(03.09.13 08:46:26 MSK)

Ответ на: комментарий от aeX1pu2b 03.09.13 08:46:26 MSK

Если дисковая полка умрет, то будет не очень хорошо :-)

fashka ★
(03.09.13 09:31:38 MSK) автор топика

Ответ на: комментарий от fashka 03.09.13 09:31:38 MSK

если она умрёт - то по-любому будет плохо и ничего работать не будет.

anonymous
(03.09.13 10:52:04 MSK)

Ссылка

Ответ на: комментарий от fashka 03.09.13 09:31:38 MSK

Ну тада надо еще городить либо clasterfs, либо HA сторадж.

aeX1pu2b ★
(03.09.13 11:42:44 MSK)

Ссылка

Ответ на: комментарий от fashka 03.09.13 09:31:38 MSK

а с чего ей умирать если на ней рейд, два контроллера и несколько б/п?

dyasny ★★★★★
(04.09.13 03:13:29 MSK)

Ответ на: комментарий от dyasny 04.09.13 03:13:29 MSK

если она умрёт - то по-любому будет плохо и ничего работать не будет.

Есть вторая. Полное зеркало.

Ну тада надо еще городить либо clasterfs, либо HA сторадж.

Glusterfs. На ней БД postgresql. Как доделаю, отпишу что как :-)

а с чего ей умирать если на ней рейд, два контроллера и несколько б/п?

Всякое бывает...

Тут резерв на «сгорело здания»

fashka ★
(04.09.13 09:32:38 MSK) автор топика

Ответ на: комментарий от fashka 04.09.13 09:32:38 MSK

Если есть вторая, и уровень паранойи на отметке «а если упадет бомба» то это немного другой сценарий, называется DR. в овирте это делается очень просто - реплицируем СХД, держим engine в виртуалке, которую точно так же реплицируем (обычно отдельный LUN на той же СХД), и при падении сервисов, все поднимаем в другом месте. Что, кстати, не отменяет надобности в бекапах, так как если какая то хрень накосячится, то косяк будет реплицирован

dyasny ★★★★★
(05.09.13 05:25:18 MSK)

Ответ на: комментарий от dyasny 05.09.13 05:25:18 MSK

Решили остановиться на Glusterfs. На тестах (выключение одной железки во время записи) показало удовлетворительный результат :-) После включения железки файл появился.

Так что, всем спасибо :-)

fashka ★
(05.09.13 17:02:54 MSK) автор топика