Правильность такого метода репликации KVM

2

9

Добрый день. Требуется настроить систему виртуализации в небольшой фирме. Выбор пал на KVM. Требуется настроить репликацию виртуальных машин между двумя нодами и периодических их бекап. Репликацию вроде как настроил через DRBD. Работает. Схема такая (для общего понимания): sda+sdb->MDADM->LVM->LV->DRBD0->KVM, то есть ссылка на диск в настройках виртуалки ведет на устройство DRBD. Верное решение? Насколько это надежно, если виртуалки будут с критически важными сервисами? Подразумевается, что если первая нода падает, заходим на вторую, повышает там реплику drbd до primary и запускаем виртуалку, которая там уже импортирована и диск у которой указан так же вида «/dev/drbd0» (secondary устройство, на которое ведет реплика с первой ноды). Сколько раз так делал в рамках теста - проблем пока не увидел. И плюс так же в том, что без перевода реплики в режим primary - виртуалку на второй ноде не запустить (ошибка вываливается). Правильный ли выбор хранить виртуалки на LVM? Ведь можно выбрать файловый вариант. Но тогда встает вопрос как вешать на них drbd (он работает только с блочными устройства). Через loop будет подходящей идеей?

И еще вопрос насчет периодического бекапа БЕЗ остановки ВМ. В файловом варианте я это делал через промежуточное создание снепшота силами virsh.. как это сделать, когда диск виртуалки это /dev/drbd0 поверх lvm? Бекапы надо складывать в сжатом виде на Synology по NFS.

Ссылка

←	Виртуальная сеть в debian

Nginx посмотреть proxy соединения

→

Посмотри с сторону linstore для drbd

Ien_Shepard ★★★
(18.03.21 18:56:06 MSK)

Ответ на: комментарий от Ien_Shepard 18.03.21 18:56:06 MSK

спасибо. Но еще хотел бы узнать… виртуалки с базами данных. Сервис критичный. Правильный выбор drbd? Это надежно?

astrave
(19.03.21 10:01:46 MSK) автор топика

Ответ на: комментарий от astrave 19.03.21 10:01:46 MSK

У баз данных есть свои механизмы репликации/кластеризации

Система (системный диск) почти статика, там раз в пол-года (условно) можно просто rsync’ом (условно) синхронизировать.

Придумываете на пустом месте проблемы и героически их пытаетесь решать.

futurama ★★★★★
(19.03.21 10:39:26 MSK)
Последнее исправление: futurama 19.03.21 10:39:48 MSK (всего исправлений: 1)

Ответ на: комментарий от futurama 19.03.21 10:39:26 MSK

Хочется сделать единую схему. Помимо баз данных будет много других сервисов. Реплика psql сейчас работает, но все на физ.серверах. Пока что. Я спросил насчет надежности drbd вцелом и для баз данных в частности.

astrave
(19.03.21 12:29:15 MSK) автор топика
Последнее исправление: astrave 19.03.21 12:30:29 MSK (всего исправлений: 1)

Поставьте Proxmox. Там и бэкапы настраиваются удобно и интерфейс понятный. Общее хранилище на CEPH для обычных сервисов и локальные диски гипервизоров для кластера БД.

dhameoelin ★★★★★
(19.03.21 21:16:57 MSK)

Ссылка

Ответ на: комментарий от futurama 19.03.21 10:39:26 MSK

Удваиваю.

dhameoelin ★★★★★
(19.03.21 21:18:51 MSK)
Последнее исправление: dhameoelin 19.03.21 21:19:46 MSK (всего исправлений: 3)

Ссылка

Придумать велосипед из костылей – это, конечно, вариант быть «незаменимым админом»… Но, когда ваш велосипед развалится – вас вздёрнут, а нам разгребать…

dhameoelin ★★★★★
(19.03.21 21:20:01 MSK)

Ответ на: комментарий от dhameoelin 19.03.21 21:20:01 MSK

Почему сразу костылей? И почему думаете, что существующие решения не обладают недостатками?

turtle_bazon ★★★★★
(19.03.21 22:13:03 MSK)

Ответ на: комментарий от turtle_bazon 19.03.21 22:13:03 MSK

Ну, конечно, самописное решение человека, который не знает, что он хочет, будет лучше, чем система, которой люди пользуются в продакшене.

А ошибки везде есть.

dhameoelin ★★★★★
(20.03.21 12:30:55 MSK)

Ответ на: комментарий от dhameoelin 20.03.21 12:30:55 MSK

вы конечно классные ребята, да… но существующий парк машин не очень мощный и на свяких цефс будут потери большие. Общего хранилища нормального НЕТ. СХД так же НЕТ. Есть несколько серверов на стареньких LGA1366, один на не очень мощных LGA2011 и один на (ВНИМАНИЕ!) на LGA771. Диски тоже везде не очень быстрые. Proxmox ставил. Все как то не быстро там с репликацией (как я понимаю из-за схемы на основе ZFS).

Почему вариант с drbd это велосипед? Вы реально хотите сказать что drbd полный шлак и не имеет права на жизнь? Или чисто так свое мнение считаете за истину и т.д. и т.п.? Пока не вижу аргументов и реальных доводов.

И с каких это пор схема с drbd это «самописное решение»?)) Оно мало где юзается?

astrave
(22.03.21 12:01:02 MSK) автор топика
Последнее исправление: astrave 22.03.21 12:03:13 MSK (всего исправлений: 2)

Люди дело говорят, используй CEPH. Без него основная трабла будет отсутствие нормального fencing-a и постоянные локи на обоих сторонах сетевого зеркала по любому чиху. Если бы сам попробовал drbd на полигоне, то уже это знал бы.

anonymous
(22.03.21 12:44:33 MSK)

Ответ на: комментарий от astrave 22.03.21 12:01:02 MSK

Если нет СХД, то Ceph может тебя спасти от потери данных.

Старенькие серверы сетапить без zfs, использовать кластеризацию Proxmox и его же Live migration + Shared Storage типа Ceph.

Вариант с DRBD – это велосипед, так как ты сам собрался делать его реализацию, а не пользуешься готовым проверенным решением. Поправь меня, если я ошибаюсь.

dhameoelin ★★★★★
(22.03.21 13:15:55 MSK)
Последнее исправление: dhameoelin 22.03.21 13:16:20 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous 22.03.21 12:44:33 MSK

да в том то и дело что тестил и сейчас тестирую drbd. sda+sdb->md0->drbd0->xfs /kvm/*.qcow2 проблем пока не заметил и меня смущает ваш негатив в сторону этого. А вот про цефс я слышал очень много историй про неторопливость и полную недееспособность для виртуальных машин.

astrave
(22.03.21 13:28:23 MSK) автор топика
Последнее исправление: astrave 22.03.21 13:28:41 MSK (всего исправлений: 1)

Ответ на: комментарий от dhameoelin 22.03.21 13:15:55 MSK

ноды будет 2. репликацию proxmox использовал и мне не понравилось то что она не в реальном времени, а порциями и с отставанием.

astrave
(22.03.21 13:29:46 MSK) автор топика

Ответ на: комментарий от astrave 22.03.21 13:29:46 MSK

Ты готовишь Proxmox неправильно.

Для кворума количество нод Proxmox >= 3.

Никакой «репликации», а общее хранилище + ha.

Почитай уже доки, блин!

Ты пытаешься использовать решение, которое, емнип, уже не поддерживается в новых ядрах.

dhameoelin ★★★★★
(22.03.21 13:34:51 MSK)

Ответ на: комментарий от astrave 22.03.21 13:29:46 MSK

Готовься ловить split brain и циклические перезагрузки.

Репликация в Proxmox не для горячей миграции, а для холодной. Когда у тебя HA виртуалки настроено на работу в группе нод А, а реплицируешься ты в группу нод Б и на другое хранилище. Чтобы в случае гибели группы нод А ты бы запустился с минимальными потерями и простоем на группе нод Б. И бэкапы никто не отменял, да.

dhameoelin ★★★★★
(22.03.21 13:39:46 MSK)
Последнее исправление: dhameoelin 22.03.21 13:40:37 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от astrave 22.03.21 13:28:23 MSK

sda+sdb->md0->drbd0->xfs /kvm/*.qcow2

Нужно больше слоёв

тестил и сейчас тестирую drbd

проблем пока не заметил и меня смущает ваш негатив в сторону этого

Ну, вот так.

вот про цефс я слышал очень много историй про неторопливость и полную недееспособность для виртуальных машин.

То есть, твой ничем не подкреплённый негатив в сторону Ceph тебя не смущает, а мой в сторону DRBD – смущает, аж «кушать не можешь»?

dhameoelin ★★★★★
(22.03.21 13:46:53 MSK)

Ссылка

Ответ на: комментарий от dhameoelin 22.03.21 13:34:51 MSK

да в том то и дело что столько нод будет неоткуда достать. и общего хранилища нет. вирты могут храниться только на конечных нодах.

Ладно. Просто тогда попрошу вас расписать наиболее подходящую схему организации.

Имеется 2 сервера, на каждом по 2x4 ядра LGA1366 и 32ГБ оперативки. Дисковая система их RAID 4xSAS 15k rpm.

Нужно чтобы на этом была заведена KVM виртуализация с репликацией виртуалки в формате qcow2 с ноды 1 на ноду 2. HA не нужен. Нужно чтобы в случае выхода из строя ноды 1, можно было запустить эти же вирты на ноде 2 (данные на ней были СВЕЖИЕ). На виртах будут psql, asterisk, почта.

astrave
(22.03.21 13:49:46 MSK) автор топика
Последнее исправление: astrave 22.03.21 13:55:09 MSK (всего исправлений: 2)

Ответ на: комментарий от astrave 22.03.21 13:49:46 MSK

Есть несколько серверов на стареньких LGA1366, один на не очень мощных LGA2011 и один на (ВНИМАНИЕ!) на LGA771

У тебя же типа есть железо, не?

dhameoelin ★★★★★
(22.03.21 14:12:24 MSK)

Ответ на: комментарий от astrave 22.03.21 13:49:46 MSK

HA не нужен

данные на ней были СВЕЖИЕ

Shared storage или x/0.

dhameoelin ★★★★★
(22.03.21 14:13:27 MSK)

Ссылка

Ответ на: комментарий от dhameoelin 22.03.21 14:12:24 MSK

типа да, но филиала ДВА. и нужно это по ним раскидать. Получается по 2 ноды. Про это не говорил, т.к. это не важно. Вопрос получается крутится вокруг «2 ноды и между ними реплика» Канал между ними примерно 15мбит. Так что считай они изолированы.

Один сервер с двумя LGA771, один с двумя E5-2620 и 2 сервера на 2 x LGA 1366. На всех серверах по 32ГБ оперативки.

astrave
(22.03.21 15:37:52 MSK) автор топика
Последнее исправление: astrave 22.03.21 15:40:14 MSK (всего исправлений: 3)

Ссылка

Ответ на: комментарий от astrave 22.03.21 13:28:23 MSK

Proxmox HA, кстати, тоже требует нормального fencing-а. Если HA не нужен, а требуется только быстрое ручное переключение VM между 2 KVM нодами, то можно сделать так. 2 ноды Ceph OSD + 1 нода MON (можно даже локальной VM), и 2 ноды KVM/libvirt. Всё. Минимализм Ceph будет даже плюсом. Отсутствие локов dlm. Минус только, что qcow2 на rbd не положишь, только raw, но зато с trim, sparse и снэпшотами. Попробуй на полигоне, понравится. Ну, да, Ceph настраивается немного посложнее Drbd, но он того стоит.

anonymous
(22.03.21 16:49:18 MSK)

Ответ на: комментарий от anonymous 22.03.21 16:49:18 MSK

2 ноды Ceph OSD + 1 нода MON (можно даже локальной VM), и 2 ноды KVM/libvirt.

Анон, пожалуйста, подробнее распиши.

И как тут кворум у Цефа должен сходиться?

dhameoelin ★★★★★
(22.03.21 16:55:25 MSK)

Ответ на: комментарий от dhameoelin 22.03.21 16:55:25 MSK

2 OSD они же MON + 1 чисто MON, кворум 2 из 3 MON. Нормально работает на 1 Гигабите, но супер-скорость мне и не нужна была.

15 Мегабит/сек? т.е. 1,5 Мегабайта в сек? Ну, с этого и надо было начинать. Для Ceph мало. Здесь уже конечно сложно что-то посоветовать, кроме велосипедов.

anonymous
(22.03.21 17:22:08 MSK)

Ответ на: комментарий от anonymous 22.03.21 17:22:08 MSK

Я так понял, что у него две площадки и 15Мб/с именно между площадками.

dhameoelin ★★★★★
(22.03.21 17:23:24 MSK)

Ответ на: комментарий от dhameoelin 22.03.21 17:23:24 MSK

совершенно верно) 2 площадки никак не связаны между собой в данном случае и их я упомянул для оправдания того, что 4 ноды на деле это 2 ноды)) А так связь между двумя нодами будет через выделенные отдельные сетевухи напрямую по гигабиту.

astrave
(22.03.21 18:01:33 MSK) автор топика

Ссылка

Ответ на: комментарий от dhameoelin 19.03.21 21:20:01 MSK

а еще такой вопрос. Я вижу что вы знаете эту тему и пытаетесь помочь. Вы писали что буду ловить split-brain. Да, такое слышал про drbd. Но я так же видел инфу, что это только когда обе ноды примари. У меня будет примари-секандари… то есть HA строить не буду. В этом случае разве так же есть риск split-brain? Ведь реплика идет только в одну сторону и ничего «встретиться» не может.

astrave
(23.03.21 14:28:24 MSK) автор топика

Ответ на: комментарий от astrave 23.03.21 14:28:24 MSK

А DRBD у тебя трафиком тоже в одну сторону обменивается?

dhameoelin ★★★★★
(23.03.21 14:56:37 MSK)

Ответ на: комментарий от astrave 23.03.21 14:28:24 MSK

Зависит от того как будет производиться проверка доступности. В любом случае надо будет настраивать stonith, иначе split-brain точно словишь. Про цеф не слушай, товарищи видимо разворачивали его только в песочнице. Особенно дятла, который предлагает size2 делать.

jewelry
(23.03.21 16:36:33 MSK)

Ссылка

Ответ на: комментарий от dhameoelin 23.03.21 14:56:37 MSK

так как может быть рассинхронизация, если конечная сторона только пишет по-сути?

astrave
(24.03.21 11:12:15 MSK) автор топика

Ответ на: комментарий от turtle_bazon 19.03.21 22:13:03 MSK

И почему думаете, что существующие решения не обладают недостатками?

ок, каким недостатком обладает mysqldump ?

~~darkenshvein~~ ★★★★★
(24.03.21 11:53:02 MSK)

Ссылка

Ответ на: комментарий от astrave 24.03.21 11:12:15 MSK

Немного не врубился в тему. Ты реплику хочешь делать с одной площадки на другую, и между площадками 15 мегабит/сек?

DALDON ★★★★★
(27.03.21 12:16:05 MSK)

12 июля 2021 г.

Ответ на: комментарий от DALDON 27.03.21 12:16:05 MSK

Нет. Реплику в рамках локальной сети)

astrave
(12.07.21 13:45:27 MSK) автор топика

Ссылка

Ответ на: комментарий от astrave 19.03.21 12:29:15 MSK

для баз данных в частности.

«Для баз данных в частности», а точнее для СУБД в вашем случае, файловая система это не всё, по этой причине использование методов F5 в nc для СУБД не применимы.

anc ★★★★★
(15.07.21 00:44:09 MSK)
Последнее исправление: anc 15.07.21 00:45:05 MSK (всего исправлений: 1)

Ответ на: комментарий от anc 15.07.21 00:44:09 MSK

использование методов F5 в nc для СУБД

А что это?

Harliff ★★★★★
(15.07.21 10:11:24 MSK)

Ответ на: комментарий от Harliff 15.07.21 10:11:24 MSK

А что это?

Не прикидывайтесь что не знаете, что такое norton commander :)

anc ★★★★★
(15.07.21 17:08:43 MSK)

Ссылка

Ответ на: комментарий от Harliff 15.07.21 10:11:24 MSK

Тупое копирование файлов БД по F5

~~Twissel~~ ★★★★★
(15.07.21 17:23:12 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Виртуальная сеть в debian

Admin

Nginx посмотреть proxy соединения

→

Похожие темы