а вам слабо почитать вики

http://wiki.postgresql.org/wiki/Postgres-XC

vadv ★★
(15.08.13 02:33:06 MSK)

Ответ на: а вам слабо почитать вики от vadv 15.08.13 02:33:06 MSK

Спасибо, не слабо. Но интересуют все-таки мнения и отзывы людей, имеющих конкретный практический опыт организации такой схемы. Но за ссылку пребольшое спасибо!

ChAnton ★★
(15.08.13 10:26:13 MSK) автор топика
Последнее исправление: ChAnton 15.08.13 10:29:01 MSK (всего исправлений: 1)

Ссылка

Не стоит пробовать делать мультимастер на уровне базы данных.

ventilator ★★★
(15.08.13 11:38:58 MSK)

Ответ на: комментарий от ventilator 15.08.13 11:38:58 MSK

Это почему же? Делают же, и вполне успешно. Есть конечно свои нюансы.

ChAnton ★★
(15.08.13 12:28:46 MSK) автор топика

Ответ на: комментарий от ChAnton 15.08.13 12:28:46 MSK

Дело в том, что прозрачно для приложения не получится мультимастер, так что проще пилить само приложение

vadv ★★
(15.08.13 14:30:40 MSK)

Ответ на: комментарий от vadv 15.08.13 14:30:40 MSK

В каком плане не получиться? Что за ерунда? Что именно не получиться? Сбалансировать соединения? Распределить механизмы чтения/записи? Почему вы так решили?

ChAnton ★★
(15.08.13 15:27:49 MSK) автор топика
Последнее исправление: ChAnton 15.08.13 15:28:26 MSK (всего исправлений: 1)

Ответ на: комментарий от vadv 15.08.13 14:30:40 MSK

Лень проверять, но я думаю ихний драйвер умеет скрывать несколько мастеров за одним клиентским соединением. И, скорее всего, балансировать нагрузку и делать failover.

true_admin ★★★★★
(15.08.13 15:41:16 MSK)

Ссылка

Ответ на: комментарий от ChAnton 15.08.13 15:27:49 MSK

Не получиться обеспечить транзакционную целостность. Например в одной транзакции покрыть блокировкой данные на обоих серверах.

Впрочем, если рассматривать базы данных как черные коробочки, то получится чего нет. Только внезапно приложения могут начать работать как то не так.

ventilator ★★★
(15.08.13 15:50:26 MSK)

Ответ на: комментарий от ventilator 15.08.13 15:50:26 MSK

Не получиться обеспечить транзакционную целостность

ЭЭээ, я так полагаю что речь идёт о синхронном мультимастере потому что асинхронный мультимастер признан вселенским злом. В таком случае проблем никаких, кмк.

true_admin ★★★★★
(15.08.13 15:52:15 MSK)

Ответ на: комментарий от true_admin 15.08.13 15:52:15 MSK

Ну и как синхронный мультимастер решает эту проблему? Кто в традиционной архитектуре будет решать конфликт когда локальный update блокирует запись которая в это же время приходит от соседнего мастера? Будет ли тут детерминированное поведение? В случае одного инстанса эта проблема решается блокировками. Для мультимастера нужно серьезно переделывать движок rdbms как это делает postgresql-XC. Вот как раз в нем есть менеджер блокировок. И это только поверхностные проблемы.

ventilator ★★★
(15.08.13 15:55:07 MSK)
Последнее исправление: ventilator 15.08.13 15:56:17 MSK (всего исправлений: 1)

Ответ на: комментарий от ventilator 15.08.13 15:55:07 MSK

Впрочем вам никто не мешает с помощью двухфазного коммита слать транзакции сразу в две базы, только это будет «несколько не то».

ventilator ★★★
(15.08.13 15:58:43 MSK)

Ссылка

Ответ на: комментарий от ventilator 15.08.13 15:55:07 MSK

Кто в традиционной архитектуре будет решать конфликт когда локальный update блокирует запись которая в это же время приходит от соседнего мастера? Будет ли тут детерминированное поведение?

нужно серьезно переделывать движок rdbms как это делает postgresql-XC

в нем есть менеджер блокировок

Ты сам ответил на свой вопрос. Конечно на все узлы запросы должны приходить в одинаковом порядке.

true_admin ★★★★★
(15.08.13 16:03:31 MSK)

Ответ на: комментарий от ChAnton 15.08.13 15:27:49 MSK

Было бы все так просто, никто бы не покупал p795, а просто брали бы и запускали мультимастеры с полпинка.

ventilator ★★★
(15.08.13 16:03:50 MSK)

Ссылка

Ответ на: комментарий от true_admin 15.08.13 16:03:31 MSK

Ты сам ответил на свой вопрос. Конечно на все узлы запросы должны приходить в одинаковом порядке.

Это вообще как? Суть мультимастера в том что на разные ноды приходят разные запросы. О каком порядке речь?

ventilator ★★★
(15.08.13 16:04:57 MSK)

Ответ на: комментарий от ventilator 15.08.13 16:04:57 MSK

Мастер — узел принимающий апдейты/селекты с приложения. Слейв — узел принимающий селекты и накатывает апдейты с мастеров. Мультимастер — наличие нескольких мастеров. Синхронный мультимастер — все апдейты синхронно прилетают на все мастера.

Асинхронный мультимастер — апдейты могут прилетать в произвольном порядке и консистентность не гарантируется. Тут или разруливать коллизии, или быть очень аккуратным с теми запросами что шлёшь.

true_admin ★★★★★
(15.08.13 16:08:20 MSK)

Ответ на: комментарий от ventilator 15.08.13 16:04:57 MSK

Асинхронный мастер работает независимо от доступности других узлов. Синхронный работает синхронно, пока все узлы не подтвердят готовность выполнить запрос/накатить апдейт ничего не будет. Скорость работы на апдейты равна скорости самого слабого звена.

true_admin ★★★★★
(15.08.13 16:09:46 MSK)

Ссылка

Ответ на: комментарий от ventilator 15.08.13 16:04:57 MSK

Наверняка есть механизмы, синхронизирующие порядок записи/реплицирования узлов. Например с отложенной записью/чтения? Или с разделением ролей на запись/чтение.

ChAnton ★★
(15.08.13 16:11:05 MSK) автор топика

Ответ на: комментарий от ChAnton 15.08.13 16:11:05 MSK

Общая распределённая запись например. Я настаиваю что это возможно потому что, например, гугловая база работает в синхронном режиме, причём синхронно на несколько датацентров: https://developers.google.com/cloud-sql/faq

Апдейты идут в две фазы: сначала получается апрув от всех баз, потом летит апдейт и завершается он когда бОльшинство узлов подтвердило коммит (это я на google io видел).

Да, задержки в разы больше чем при асинхронной работе, но зато если у них сдохнет пара датацентров то никто не заметит.

true_admin ★★★★★
(15.08.13 16:13:56 MSK)

Ответ на: комментарий от true_admin 15.08.13 16:08:20 MSK

Вы неправильно читаете синхронный/асинхронный.

Синхронный - успешный коммит транзакции на ноде, означает что все остальные ноды записали изменения блоков которые сделала эта транзакция на диск. Иными словами в любом момент времени все инстансы содержат идентичные данные.

Асинхронный - успешный коммит транзакции на ноде, означает что локальная нода записала изменения блоков которые сделала эта транзакция на диск. Остальные ноды данные могут записать позже.

все апдейты синхронно прилетают на все мастера.

Так лучше не делать, тк апдейт может менять данные на разных нодах по разному (update .. set name=random()...). Я бы сказал вообще что все решения основанные на репликации sql стрима опасны. Гораздо правильнее реплицировать логи транзакций в которых отображаются изменения данных, а не команды sql.

ventilator ★★★
(15.08.13 16:21:33 MSK)

Ответ на: комментарий от true_admin 15.08.13 16:13:56 MSK

А что скажете про организацию мультимастера на Pgpool II, вроде как она сейчас позволяет такое изготовить? Даже примеры где-то видел. Правда некоторые люди ссылаются на то, что он якобы «не совсем мастер», что это означает, мне пока непонятно. Есть еще Bucardo, но говорят что он асинхронный.

ChAnton ★★
(15.08.13 16:23:09 MSK) автор топика

Ответ на: комментарий от ventilator 15.08.13 16:21:33 MSK

Кстати, а Postges умеет реплицирование логов транзакций?

ChAnton ★★
(15.08.13 16:25:58 MSK) автор топика

Ответ на: комментарий от true_admin 15.08.13 16:13:56 MSK

Апдейты идут в две фазы: сначала получается апрув от всех баз, потом летит апдейт и завершается он когда бОльшинство узлов подтвердило коммит (это я на google io видел).

Это вы описали немного искаженно двухфазный коммит. К слову после первой фазы блокировки держатся до завершения второй. И либо вы используете приложение которое это умеет как говорил vadv либо запиливаете это в движок как делает postgresql-xc.

ventilator ★★★
(15.08.13 16:26:40 MSK)

Ссылка

Ответ на: комментарий от ChAnton 15.08.13 16:23:09 MSK

А что скажете про организацию мультимастера на Pgpool II, вроде как она сейчас позволяет такое изготовить? Даже примеры где-то видел. Правда некоторые люди ссылаются на то, что он якобы «не совсем мастер», что это означает, мне пока непонятно.

Работает, юзать не стоит если вы цените свои данные.

ventilator ★★★
(15.08.13 16:27:16 MSK)

Ответ на: комментарий от ventilator 15.08.13 16:27:16 MSK

Работает, юзать не стоит если вы цените свои данные.

Аргументы? Именно в отношении Pgpool...

ChAnton ★★
(15.08.13 16:28:58 MSK) автор топика

Ответ на: комментарий от ChAnton 15.08.13 16:25:58 MSK

Кстати, а Postges умеет реплицирование логов транзакций?

Да, именно так там мастер-слейв и сделан. Есть как синхронный, так и асинхронный режим.

ventilator ★★★
(15.08.13 16:29:02 MSK)

Ответ на: комментарий от ventilator 15.08.13 16:21:33 MSK

апдейт может менять данные на разных нодах по разному (update .. set name=random()...). Я бы сказал вообще что все решения основанные на репликации sql стрима опасны.

Есть statement based репликация, а есть bin/WAL-log based replication. В первом случае можно всё легко сломать, но, например, в мануале к mysql об этом чётко было сказано (по-моему, от первого вида вообще отказались т.к. переслать результат транзакции дешевле чем грузить все сервера запросами). Впрочём, я вижу что ты в этом сечёшь :). Но я не понимаю почему ты говоришь что это практически невозможно.

true_admin ★★★★★
(15.08.13 16:30:25 MSK)

Ответ на: комментарий от ventilator 15.08.13 16:29:02 MSK

Ну приблизительно как в MySQL короче. Но это мастер-слейв. А мне бы нужен именно мастер-мастер.

ChAnton ★★
(15.08.13 16:30:28 MSK) автор топика

Ответ на: комментарий от ChAnton 15.08.13 16:28:58 MSK

В том режиме работы о котором вы говорите, Pgpool «просто» шлет sql сразу на все ноды. Ситуации типа update .. set name=random() вы должны сами обойти. Если не обойдете - получите разные данные на двух нодах. Легко и просто можно получить проблемы с sequence тоже. Кроме того обслуживать это весьма непросто. Если один из серверов остановится на время, весьма трудоемко его вводить в строй.

ventilator ★★★
(15.08.13 16:31:55 MSK)

Ответ на: комментарий от ChAnton 15.08.13 16:23:09 MSK

А что скажете про организацию мультимастера на Pgpool II

ничего, кроме того что постгрес излишне сложен в администрировании. pgpool2 я поднимал только один раз в mastser-slave режими, натрахался с триггерами и процедурами по самое небалуйся. Больше не хочу такого.

true_admin ★★★★★
(15.08.13 16:32:26 MSK)

Ответ на: комментарий от true_admin 15.08.13 16:30:25 MSK

Но я не понимаю почему ты говоришь что это практически невозможно.

Я вижу два пути:
а) Для этого нужно серьезно переделать движок, как делает postgresql-XC или mysql ndb cluster(врагу не пожелаю столкнуться с этим говном),Oracle RAC(немного не в ту степь но все же). Все переделки обеспечивают совместимость только до определенного уровня. И добавляют некоторые проблемы.

б) Приложение должно быть написано чтобы работать с несколькими базами. Часто бывает что выгоднее масштабироваться покупкой p795 чем это делать.

Пути с несвязанными базами, которые реплицируют по кругу что либо - не дадут гарантии целостности данных. Вы можете уточнить вопрос на sql.ru и там вам дадут идентичный ответ.

ventilator ★★★
(15.08.13 16:37:17 MSK)
Последнее исправление: ventilator 15.08.13 16:38:26 MSK (всего исправлений: 1)

Ответ на: комментарий от ventilator 15.08.13 16:31:55 MSK

В том режиме работы о котором вы говорите, Pgpool «просто» шлет >sql сразу на все ноды. Ситуации типа update .. set >name=random() вы должны сами обойти. Если не обойдете - >получите разные данные на двух нодах. Легко и просто можно >получить проблемы с sequence тоже. Кроме того обслуживать это >весьма непросто. Если один из серверов остановится на время, >весьма трудоемко его вводить в строй.

Понял вас. Очень поучительно. Буду думать теперь как этот процесс провести и реализовать схему в том числе и с учетом обозначенных нюансов.

ChAnton ★★
(15.08.13 16:39:28 MSK) автор топика

Ответ на: комментарий от true_admin 15.08.13 16:32:26 MSK

Интересно. Видимо придется пробовать каждое из названных решений и смотреть что будет получаться.

ChAnton ★★
(15.08.13 16:40:11 MSK) автор топика

Ссылка

Ответ на: комментарий от ChAnton 15.08.13 16:39:28 MSK

Ну если вам хочется по граблям - никто не запретит. Лучше бы изложили задачу более полно. Вероятно есть более красивый путь решения, который не приведет к уменьшению надежности.

ventilator ★★★
(15.08.13 16:42:22 MSK)

Ссылка

Ответ на: комментарий от ChAnton 15.08.13 16:30:28 MSK

Мы используем master-master, но на TimesTen. Там реплицируется транзакционный лог. Есть способ борьбы с конфликтами и также способ их обнаружения. 100% гарантии это не дает, но для нас приемлимо. И да, у нас как приложение устроено так, чтобы снизить вероятность одновременной модификации строк на двух узлах.

vromanov ★★★
(15.08.13 16:44:23 MSK)

Ответ на: комментарий от vromanov 15.08.13 16:44:23 MSK

И? Если не секрет или коммерческая тайна, поделитесь? Это именно решение на Postgres?

ChAnton ★★
(15.08.13 16:47:09 MSK) автор топика

Ответ на: комментарий от true_admin 15.08.13 16:32:26 MSK

постгрес излишне сложен в администрировании.

Постгрес просто позволяет сделать гораздо больше чем mysql). Например всегда умел влючать логгирование запросов без даунтайма. И много еще чего без даунтайма.

А то как в mysql любят, вообще веселит: нужно сделать консистентный бекап чтобы поднять слейв? - извольте залочить всю базу, пока ваши 300гб задампятся, ну или конечно можете взять левые тулзы которые может сработают. Хотя может уже в mysql что то сделали на эту тему.

ventilator ★★★
(15.08.13 16:47:56 MSK)

Ответ на: комментарий от ChAnton 15.08.13 16:47:09 MSK

Если это тот vromanov, то и для postgresql есть версия)

ventilator ★★★
(15.08.13 16:48:57 MSK)

Ответ на: комментарий от ChAnton 15.08.13 16:47:09 MSK

Нет это совсем другая комерческая InMemory база данных. Сейчас мы сделали, чтобы приложение работало либо с TimesTen, либо с Postgress. В постгрессе от репликации решили отказаться (уж больно много граблей везде описано) и решать вопрос на уровне приложения.

vromanov ★★★
(15.08.13 16:51:01 MSK)

Ответ на: комментарий от ventilator 15.08.13 16:48:57 MSK

Маска, я тебя знаю :)

vromanov ★★★
(15.08.13 16:52:42 MSK)

Ответ на: комментарий от vromanov 15.08.13 16:52:42 MSK

да ну?

ventilator ★★★
(15.08.13 16:53:15 MSK)

Ссылка

Ответ на: комментарий от vromanov 15.08.13 16:52:42 MSK

Все таки думаю ты ошибся), irl мы точно не знакомы)

ventilator ★★★
(15.08.13 16:58:50 MSK)

Ссылка

Ответ на: комментарий от vromanov 15.08.13 16:51:01 MSK

Понятно. Но увы, это не PostgreSQL (

ChAnton ★★
(15.08.13 17:21:34 MSK) автор топика

Ссылка

Ответ на: комментарий от ventilator 15.08.13 16:47:56 MSK

А как же многочисленные форки от мускуля, например Percona XDB (Наверное аналог Postgre XC в какой-то мере), или MariaDB ? Не сам MySQL(аля-Oracle) конечно, но все-таки)))

ChAnton ★★
(15.08.13 17:23:49 MSK) автор топика

Ответ на: комментарий от true_admin 15.08.13 16:32:26 MSK

А с чем конкретно у вас были трудности, в части триггеров и процедур в Postgres ?

ChAnton ★★
(15.08.13 17:26:08 MSK) автор топика

Ответ на: комментарий от ventilator 15.08.13 16:47:56 MSK

300гб

mysql

you're doing it wrong :)

извольте залочить всю базу

достаточно дамп делать в одной транзакции. Если используется myisam то ой. Да можно просто бинарно скопировать. Стопанул базу, сделал снапшот фс и льёшь на другой сервер как есть.

true_admin ★★★★★
(15.08.13 18:05:14 MSK)

Ответ на: комментарий от ChAnton 15.08.13 17:23:49 MSK

Форки это круто, но хотелось бы стабильного продукта, а не 100500 различных вариаций в каждой из которых запилена какая то фича. Percona XDB судя по всему сделана из галеры http://codership.com/ Когда я смотрел галеру, у меня было много вопросов и мало документации. Мне показалось что опрометчиво делать ставку на решение которое не обкатано и слабо описано. Кроме того минусом всех mysql-based решений было отсутствие hash/merge join алгоритмов, которые давали неплохое ускорение на наших запросах.

ventilator ★★★
(15.08.13 18:20:53 MSK)

Ссылка

Ответ на: комментарий от ventilator 15.08.13 16:37:17 MSK

Все переделки обеспечивают совместимость только до определенного уровня. И добавляют некоторые проблемы.

Тут ещё требования к надёжности играют. Часто нужна тупо производительность, а то что базы немного разные бывает что и пофиг. К тому же придуманы скриптики для сравнения баз и добавления недостающих строк :)

А я вообще не верю что можно изначально кривые приложения не расчитанные на масштабируемость полностью «вылечить» кустарными средствами.

Что касается всяких оракловых решений, то, кмк, там своего секса ого-го. И я считаю это исключительно результат криворукости дизайна (мускла и pg это тоже касается). Если простые и нужные вещи делаются только после прочтения кучи манов то тут или на поддержке бабло отбивают, или сделано неправильно.

true_admin ★★★★★
(15.08.13 18:28:05 MSK)

Ответ на: комментарий от ChAnton 15.08.13 17:26:08 MSK

Просто очень сложно, везде грабли. Ты не можешь, например, просто так добавить таблицу, надо ещё при этом кучу действий сделать аля добавить нужные триггеры итп. Короче, мануал надо прочитать весь от и до, там всё подробно написано.

true_admin ★★★★★
(15.08.13 18:28:43 MSK)

Ответ на: комментарий от true_admin 15.08.13 18:05:14 MSK

Стопанул базу, сделал снапшот фс и льёшь на другой сервер как есть.

Получил даунтайм и холодный кеш.

Вообще это я к неудобности постгреса). Бинарное копирование там предусмотрено и делается на ходу без остановки базы.

ventilator ★★★
(15.08.13 18:33:40 MSK)

Ответ на: комментарий от true_admin 15.08.13 18:28:05 MSK

А я вообще не верю что можно изначально кривые приложения не расчитанные на масштабируемость полностью «вылечить» кустарными средствами.

+100500

ventilator ★★★
(15.08.13 18:34:24 MSK)

Ссылка

а вам слабо почитать вики

Похожие темы