DRBD принято в ядро Linux

0

0

После 10 лет скандалов, дебатов и разногласий, в основную ветку ядра Linux наконец-то принято DRBD - решение для репликации блочных устройств, позволяющее создать на абсолютно любой файловой системе кластер высокой доступности.

DRBD предоставляет особые блочные устройства: чтение с ним превращается в чтение с локального жесткого диска, а запись идет на локальный диск и расходится на заданные ноды DRBD-кластера.

Напомним, что ядра с DRBD поставляются уже много лет многими вендорами под марками «кластерных решений для enterprise». Отметим, что DRBD до сих пор является единственным работающим решением, позволяющим осуществить резервирование мастер-нод многих почтовых кластеров, метаданных распределенных файловых систем, key-value хранилищ или телеком-серверов.

>>> Подробности

Ссылка

← Aquaria open beta

OpenVPN 2.1.1 →

← 1 2 →

Ответ на: комментарий от maxcom 15.12.09 22:57:34 MSK

имхо не сильно удобно реализована репликация через wal. multi-master куда удобней

alt0v14 ★★★
(15.12.09 23:16:20 MSK)

Ссылка

Ответ на: комментарий от maxcom 15.12.09 22:57:34 MSK

>> постгресс давно через журнал транзакций умеет реплицироваться

Расскажи, плз, как? Ссылочку чтоль кинь... Помню, недавно гуглил по репликации в слонике, так ничего кроме slony-I нету. Кстати, мож ещё знаешь, мультимастер в слонике ещё не осилили?

~~Saloed~~ ☆
(15.12.09 23:25:07 MSK)

Ответ на: комментарий от Alinaki 15.12.09 21:19:13 MSK

c nouveau на Ubuntu не тормозит

anonymous
(15.12.09 23:25:08 MSK)

Ссылка

Ответ на: комментарий от maxcom 15.12.09 22:57:34 MSK

А есть какая-нибудь статейка про это. А то я только про слонов видел.

dimag ★
(15.12.09 23:32:17 MSK)

Ответ на: комментарий от Black_Shadow 15.12.09 23:02:06 MSK

Я, может, чего-то не понимаю, но... DRBD - это блочное устройство, на нём есть файловая система, у которой есть свой кеш, о котором блочное устройство не знает. У СУБД, база которой лежит на этой ФС, тоже есть свой кеш, о котором не знает файловая система, и тем более блочное устройство. Таким образом, в каждый момент времени на блочном устройстве лежат неконсистентные данные. Каким же тогда образом DRBD может помочь в создании кластера СУБД?

Можно поставить на GFS на Dual primary.

anonymous
(15.12.09 23:34:53 MSK)

Ответ на: комментарий от anonymous 15.12.09 23:34:53 MSK

>Я, может, чего-то не понимаю, но... DRBD - это блочное устройство, на нём есть файловая система, у которой есть свой кеш, о котором блочное устройство не знает. У СУБД, база которой лежит на этой ФС, тоже есть свой кеш, о котором не знает файловая система, и тем более блочное устройство. Таким образом, в каждый момент времени на блочном устройстве лежат неконсистентные данные. Каким же тогда образом DRBD может помочь в создании кластера СУБД?

Так лог и будет реплицироваться. А когда failover случится, новый инстанс БД обрежет все незакомиченные транзакции и побежит дальше. Поправьте пожалуйста, если так не будет работать

dimag ★
(15.12.09 23:37:57 MSK)

Ответ на: комментарий от dimag 15.12.09 23:37:57 MSK

Ну тут два классических варианта - либо управление приложению не возвращается, пока все ноды в кластере не подтвердят успешную запись - тогда имеем тормоза, либо write вернет управление после записи блока локально - тогда имеем, фактически, гарантированно inconsistent данные при падении мастера.

Третье дано только если приложение знает о структуре хранилища, а если оно знает, оно будет использовать более эффективные методы репликации чем drbd.

slovazap ★★★★★
(15.12.09 23:49:43 MSK)

Ссылка

Ответ на: комментарий от Saloed 15.12.09 23:25:07 MSK

master-master есть в bucardo (асинхронный) и cybercluster (синхронный). и то и другое решение требует чёткого понимания области применимости и очень аккуратного обслуживания например.

так же стоит посмотреть на pl/proxy например, да и вообще на skytools. а то может нужна то вовсе не репликация :)

Popil_Bablosov ★
(15.12.09 23:53:23 MSK)

Ответ на: комментарий от Black_Shadow 15.12.09 23:02:06 MSK

> Каким же тогда образом DRBD может помочь в создании кластера СУБД?

ну как бы у баз данных обычно свои велосипеды для кластеризации. А вот для почтового сервака кластер сделать - самое оно. Или для любого сервиса, который не подозревает о возможности его кластеризации. После смерти одной ноды можно пускать сервис на другой с последними рабочими данными.

deadman ★★
(15.12.09 23:55:01 MSK)

Ссылка

Ответ на: комментарий от dimag 15.12.09 23:37:57 MSK

так будет работать, но drbd для этого не нужен чуть более, чем совсем. а нужен walmgr, например.

Popil_Bablosov ★
(15.12.09 23:55:44 MSK)

Ссылка

Ответ на: комментарий от Popil_Bablosov 15.12.09 23:53:23 MSK

Спасибо, гляну.

~~Saloed~~ ☆
(16.12.09 00:01:38 MSK)

Ссылка

Лучше бы баг с тормозами SATA пофиксили.

anonymous
(16.12.09 00:12:25 MSK)

Ссылка

А потом еще иксы в ядро пихнут. Лучше бы производительностью занялись. Последнее кстати многих касается (каюсь, включая меня).

upcFrost ★★★★★
(16.12.09 00:28:25 MSK)

А зачем оно в ядре? Штука полезная, но смысла пихать в ведро не вижу.

~~DELIRIUM~~ ☆☆☆☆☆
(16.12.09 00:53:01 MSK)

Ответ на: комментарий от sersto 15.12.09 21:13:10 MSK

>Анонимус одобряэ. Еще один шаг к энтерпрайзу.

sersto (*) (15.12.2009 21:13:10)

разлогинься для начала :)

~~k0l0b0k~~ ★★
(16.12.09 01:12:11 MSK)

Ссылка

Ответ на: комментарий от DELIRIUM 16.12.09 00:53:01 MSK

>А зачем оно в ядре? Штука полезная, но смысла пихать в ведро не вижу.

Нельзя это реализовать иначе чем как в ядре.
Нет аналога FUSE и CUSE (Character device in Userspace) для блочных устройств.

ntoo
(16.12.09 03:58:31 MSK)

Ответ на: комментарий от ntoo 16.12.09 03:58:31 MSK

да вроде есть....

NBD вроде давно в ядре было. А оно в какой-то мере и есть Block Device in Userspace. А ещё есть snumbd от Acronis (с исходниками), который без использования netlink (свой API) уж точно реализует указанный интерфейс (обращение к блоку на чтение-запись передаётся в userspace-daemon)

seyko2 ★
(16.12.09 05:44:59 MSK)

ну было оно раньше отдельно в пакетном менеджере, теперь напрямую в ядре

в чём паника недоизбранных? они до сих пор на системе from scratch сидят, что-ли?

anonymous
(16.12.09 05:55:15 MSK)

Ссылка

Ответ на: комментарий от Klausd 15.12.09 21:11:32 MSK

>Скандалил, скандалили, скандалил. софтниночку в ядро запи**ярили!!!

Это ты про Аэро в В7 чтоли? Линукс как ядро кстати по факту намного стабильнее чем любое другое.

ABTOP ★
(16.12.09 06:14:37 MSK)

Ссылка

+

вообще, давно пора это сделать. http://www.xgu.ru/wiki/AoE бы еще допилить до надлежащего уровня...

ABTOP ★
(16.12.09 06:23:25 MSK)

Ссылка

Ответ на: комментарий от Saloed 15.12.09 23:25:07 MSK

> Кстати, мож ещё знаешь, мультимастер в слонике ещё не осилили?

Нет. Очень мало задач, где это _реально_ нужно, а сам по себе мультимастер реально много проблем добавляет. Для PostgreSQL были какие-то решения (по-моему в основном коммерческие), но все с оговорками.

Evgueni ★★★★★
(16.12.09 07:43:31 MSK)

Ссылка

Ответ на: комментарий от dimag 15.12.09 23:32:17 MSK

http://www.postgresql.org/docs/8.4/interactive/high-availability.html

maxcom ★★★★★
(16.12.09 09:03:30 MSK)

Ссылка

за сим почётный съезд постресменов объявляется открытым

anonymous
(16.12.09 09:11:59 MSK)

Ответ на: комментарий от anonymous 16.12.09 09:11:59 MSK

>постресменов

прочитал как «петросянов» :)

~~zHACKa~~ ★
(16.12.09 09:38:58 MSK)

Ответ на: DRBD принято в ядро Linux от dimag 15.12.09 21:23:49 MSK

> А можно ДБ реплицировать при помощи такой штуки? Хотелось бы задать PostgreSQL data директорию и сказать, чтоб она реплицировалась на несколько других машин или хотя бы дисков, ну и естественно в реальном времени. Кто-нибудь слышал про такие решения? Альтернатива от Isilon стоит >100К

Есть такой PgCluster - репликация мастер-мастер в реальном времени. Поставили недавно в бой (примерно 3 месяца) — пока работает нормально.

avbochagov ★
(16.12.09 10:00:08 MSK)

Ссылка

Ответ на: комментарий от zHACKa 16.12.09 09:38:58 MSK

> прочитал как «петросянов» :)

Еугеуней не петросян! Бери выше! САМ Задорнов!

anonymous
(16.12.09 10:02:15 MSK)

Ссылка

Ответ на: комментарий от upcFrost 16.12.09 00:28:25 MSK

>А потом еще иксы в ядро пихнут. Лучше бы производительностью занялись.

Один из неплохих способов поднять производительность иксов - пихнуть их в ядро. Как nfs-kernel-server. Нестабильности это почти не добавит, ибо глючные 3в-драйверы и так в ядре, а в vesa-режиме иксы стабильны как скала.

legolegs ★★★★★
(16.12.09 10:25:51 MSK)

Ссылка

Ответ на: комментарий от alt0v14 15.12.09 22:33:58 MSK

пробовали drbd во всех режимах+

Выводы: работает оно более-менее нормально ТОЛЬКО при прямом соединении двух машин шнурком. ТОЛЬКО при мастер-слейв конфигурации. И безо всяких fs типа OCFS1/2. Речь естественно идет про применение кластера под хотя бы более-менее средней нагрузкой.

Растяжка между ДЦ - лаги и заморозки. А это собственно самое интересное в любой кластерной технологии. Мастер-мастер (и как следствие OCFS) дает неконтроллируемые глюки под нагрузкой, просто тупо интерраптятся сисколы на чтение-запись. Применять это под ДБ - самоубийство. Тормоза дикие точно будут, а то и повезет - будут феерические глюки из-за периодических обрывов попыток чтения блоков данных.

В результате: репликация - наше все.

зы: устриц ел в рамках двух крупных интернет-порталов, один из которых Яндекс.

Yorick(C)

anonymous
(16.12.09 10:29:42 MSK)