Отказоустойчевый кластер, как?

3

4

Доброго времени суток. Прошу помощи или подсказки, в какую сторону копать. Задача: Из нескольких компов, возможно даже с разными конфигурациями собрать «отказоустойчивый» кластер. Главно особенностью должно быть,то что все компьютеры должны работать !параллельно. Не в плане что запустил одно приложение на главной машине и он пользуется мощностями остальных, А запустив приложение на 1 оно запускается на 2,3,... и работате как зеркала, выполняя все абсолютно оданаковы действия. И если один из компов упадет, остальные продолжат работать, как будто ничего не произошло. Тоесть не должно быть какого-то ведущего и ведомых машин. Буду благодарен любой помощи.

Ссылка

← Новомодный оркестратор: Archipel

arch+systemd поднять сеть и ssh до монтирования шифрованных томов →

а виртуализация тут причём ?

i_gnatenko_brain ★★★★
(10.03.13 09:42:52 MSK)

Ссылка

что конкретно они должны делать?

dyasny ★★★★★
(10.03.13 09:49:51 MSK)

Ответ на: комментарий от dyasny 10.03.13 09:49:51 MSK

Один из вариантов, должно крутится много виртуальных машин

z3r0s
(10.03.13 09:53:10 MSK) автор топика

ТС будь добр, опиши ТЗ подробнее.

MikeDM ★★★★★
(10.03.13 10:15:44 MSK)

Ответ на: комментарий от MikeDM 10.03.13 10:15:44 MSK

Тз никогда не писал, но попробую. Есть несколько виртуальных машин(50-100), которые должны работать непрерывно. Если вдруг одна из физических машин упадет, это никак не должно повлиять на работу виртуальных машин. Тоесть не суммарная мощность всех физ компов отдается на растерзание этим виртуалка, а все виртуалки крутятся параллельно на всех физ компах. Такое вообще реально?

z3r0s
(10.03.13 10:21:23 MSK) автор топика

Ответ на: комментарий от z3r0s 10.03.13 10:21:23 MSK

Да, необходимо СХД. Лучше несколько для отказоустойчивости из которых собрать рейды и отдать под диски виртуальных машин.

petav ★★★★★
(10.03.13 10:46:55 MSK)

Ответ на: комментарий от z3r0s 10.03.13 10:21:23 MSK

Такое вообще реально?

Ты только что изобрел VMware vSphere.

~~zgen~~ ★★★★★
(10.03.13 10:54:52 MSK)

Ссылка

Ответ на: комментарий от petav 10.03.13 10:46:55 MSK

А ты - vSphere Storage Appliance ;)

~~zgen~~ ★★★★★
(10.03.13 10:57:47 MSK)

подобных решений достаточно много, и насколько я понял задачу тут может помочь это http://www.openstack.org ну или proxmox.

Komintern ★★★★★
(10.03.13 11:47:08 MSK)

Ссылка

Ответ на: комментарий от zgen 10.03.13 10:57:47 MSK

zgen, я про решения «из коробки» в последнюю очередь думаю.

petav ★★★★★
(10.03.13 12:51:58 MSK)

Ссылка

Ответ на: комментарий от z3r0s 10.03.13 09:53:10 MSK

просто крутить много ВМ может очень много разных решений. держать их всех синхронизированными может vmware FT, с ограничением на синхронизацию только двух ВМ, с ограниченным кол-вом памяти и одним виртуальным процессором. Так чтоб множество ВМ были одновременно в lock-step слишком сложно для FT.

я потому и спросил насчет конкретной аппликации - некоторые из них умеют работать в active-active кластере, что, возможно, позволит решить задачу.

dyasny ★★★★★
(10.03.13 12:55:27 MSK)

Ответ на: комментарий от dyasny 10.03.13 12:55:27 MSK

держать их всех синхронизированными может vmware FT

в том числе

petav ★★★★★
(10.03.13 13:00:34 MSK)

Ответ на: комментарий от dyasny 10.03.13 12:55:27 MSK

Все бы хорошо, но vmware слишком дорог. Может есть какие-нибудь бесплатные, или менее дорогие решения.

z3r0s
(10.03.13 13:08:34 MSK) автор топика

Ответ на: комментарий от z3r0s 10.03.13 13:08:34 MSK

KVM + pacemaker + разделяемое хранилище. Или коробочные решения, типа proxmox.

P.S.: Я не знаю что у Вас за задача, что за сервера, что за бюджет. Еще DRBD как разделяемое хранилище можно использовать, но это только для кластера из двух нод.

petav ★★★★★
(10.03.13 13:13:55 MSK)
Последнее исправление: petav 10.03.13 13:15:16 MSK (всего исправлений: 1)

Ссылка

судя по тз - ман беовульф

bk_ ★★
(10.03.13 13:16:04 MSK)

Ссылка

Ответ на: комментарий от petav 10.03.13 13:00:34 MSK

из того что можно использовать в production?

хотя, если честно, FT - слабоват для нормальной работы, слишком много ограничений

dyasny ★★★★★
(10.03.13 14:27:14 MSK)

Ответ на: комментарий от z3r0s 10.03.13 13:08:34 MSK

ответа я видимо не дождусь...

полная синхронизация, это когда состояние памяти (и дисков, если это не один диск на всех), постоянно синхронизируется, как бы постоянная живая миграция из одной ВМ в остальные, без переключения.

а/а кластер это проще, но не любая аппликация это умеет, a/p проще и универсальнее, но будет какой-то небольшой даунтайм.

поэтому вопрос - что _конкретно_ надо защитить?

dyasny ★★★★★
(10.03.13 14:29:58 MSK)

Ответ на: комментарий от dyasny 10.03.13 14:27:14 MSK

из того что можно использовать в production?

Я не уловил сути? Вы имеете виду что ни чего кроме vmware не годится для использования в production?

petav ★★★★★
(10.03.13 14:34:51 MSK)

Ответ на: комментарий от dyasny 10.03.13 14:29:58 MSK

полная синхронизация, это когда состояние памяти (и дисков, если это не один диск на всех), постоянно синхронизируется, как бы постоянная живая миграция из одной ВМ в остальные, без переключения.

А можно поподробнее этот момент. Как это «постоянно синхронизируется, как бы постоянная живая миграция»?

petav ★★★★★
(10.03.13 14:36:42 MSK)

Ответ на: комментарий от petav 10.03.13 14:36:42 MSK

Как это «постоянно синхронизируется, как бы постоянная живая миграция»?

Представьте, что у вас есть сервер на котором работают 100500 пользователей. И вдруг этот сервер падает.

Хочется, чтобы 100500 пользователей этого вообще не заметили. Как?

OK. Разделяемое хранилище. И что? Экземпляр VM падает, вся текущая (не сохраненная) работа теряется. Конечно, другой хост может стартануть VM с разделяемого хранилища, но это будет обычный себе downtime.

Тут же, на другом хосте одновременно с основной запускается еще одна копия VM, в которую постоянно прибывают все изменения в ОЗУ (читай master-slave), при краше основной VM резервная просто переходит в статус master, на момент X она является полной копией основной, включая текущее наполнение ОЗУ как будто ничего и не падало.

Просто чел слишком хитро выражается.

~~zgen~~ ★★★★★
(10.03.13 14:48:54 MSK)

Ответ на: комментарий от zgen 10.03.13 14:48:54 MSK

Это я себе представляю, пока не представляю как второй вариант реализовывается кроме проприетарных продуктов. Не подкинете направление, на почитать. В pacemaker это все можно заскриптовать!?

petav ★★★★★
(10.03.13 15:03:13 MSK)
Последнее исправление: petav 10.03.13 15:09:46 MSK (всего исправлений: 2)

Ответ на: комментарий от petav 10.03.13 15:03:13 MSK

Нашел чуть больше информации по этому вопросу.

petav ★★★★★
(10.03.13 15:15:25 MSK)
Последнее исправление: petav 10.03.13 15:15:34 MSK (всего исправлений: 1)

Ответ на: комментарий от zgen 10.03.13 14:48:54 MSK

Все в точности как вы и написали. Задача реализовать именно такую «отказоустойчивую» систему. Небольшой даунтайм(до несокльких секунд) между падением и подменой, возможн. Вот только как это реализовать?

z3r0s
(10.03.13 16:45:23 MSK) автор топика

Ответ на: комментарий от petav 10.03.13 15:15:25 MSK

Прочитал. Походу «живая миграция», как и предполагалось, не такая уж и простая задача.

z3r0s
(10.03.13 16:50:16 MSK) автор топика

Ответ на: комментарий от petav 10.03.13 14:34:51 MSK

FT - единственное что хоть отдаленно стабильно и оттестировано. Я бы это не использовал, но если ограничения и цена не смущают, то кто-то наверное все таки пользуется

dyasny ★★★★★
(10.03.13 18:22:53 MSK)

Ссылка

Ответ на: комментарий от petav 10.03.13 15:15:25 MSK

ну и отлично, не придется заново все расписывать :)

dyasny ★★★★★
(10.03.13 18:25:40 MSK)

Ответ на: комментарий от z3r0s 10.03.13 16:45:23 MSK

самое простое - любая система виртуализации умеющая HA, или HA кластеры с VM как защищенный сервис. Будут нюансы, но вы все никак не расскажете что конкретно пытаетесь защитить от отказов.

dyasny ★★★★★
(10.03.13 18:27:55 MSK)

Ответ на: комментарий от z3r0s 10.03.13 16:50:16 MSK

непростая, и даже немного рискованная

dyasny ★★★★★
(10.03.13 18:28:24 MSK)

Ссылка

Ответ на: комментарий от z3r0s 10.03.13 16:45:23 MSK

Если в таком контексте, то выше даны ответы мной и dyasny.

petav ★★★★★
(10.03.13 18:44:37 MSK)

Ссылка

Ответ на: комментарий от dyasny 10.03.13 18:25:40 MSK

petav ★★★★★
(10.03.13 18:53:40 MSK)

Ссылка

Ответ на: комментарий от z3r0s 10.03.13 16:45:23 MSK

бесплатно? xen вам в зубы и напильник.

~~zgen~~ ★★★★★
(10.03.13 20:16:12 MSK)

Ссылка

Ответ на: комментарий от dyasny 10.03.13 18:27:55 MSK

Защитить необходимо поток данных, идущих с/на вирт машины, от обрыва (причем задержка на востановление после обрыва в 5-15 сек не критична). со стабильностью электропитания и интернетом все проще. остается только вопрос софта.

z3r0s
(10.03.13 21:58:05 MSK) автор топика

Ответ на: комментарий от z3r0s 10.03.13 21:58:05 MSK

Защитить необходимо поток данных от обрыва

т.е. сначала Вам нужно понять, что Вы хотите?

petav ★★★★★
(10.03.13 22:03:18 MSK)

Ответ на: комментарий от petav 10.03.13 22:03:18 MSK

Это вопрос? я прекрасно понимаю, что хочу. обрыв данных может быть из за внешних факторов, таких как электричество, интернет, наводнение,... и внутренних, программных. Вот по поводу способа, как на 100% избавиться от последних и ведется данная беседа.

z3r0s
(10.03.13 22:20:01 MSK) автор топика

Ответ на: комментарий от z3r0s 10.03.13 22:20:01 MSK

У Вас тема обширнее чем Вы ее представили. Естественно существуют способы реализации, что Вам нужно (по моим догадкам), но это будет стык технологий и серьезная системная интеграция.

Допускаю вариант, что я не верно Вас понял и все намного проще.

petav ★★★★★
(10.03.13 22:50:51 MSK)

Ссылка

Ответ на: комментарий от z3r0s 10.03.13 21:58:05 MSK

Защитить необходимо поток данных, идущих с/на вирт машины, от обрыва

что это за данные, какие объемы, какой формат, какие скорости и задержки - «поток данных» может быть и сервер толкающий интернет радио, и нода MRG, разница огромная

причем задержка на востановление после обрыва в 5-15 сек не критична

фейловер это запуск упавшей ВМ на другой ноде, что обычно займет немного дольше. плюс время на отработку SBA, я бы взял 3-5 минут на фейловер как минимум. фейловер кластер на уровне аппликации будет быстрее, но для того чтоб советовать надо знать о какой аппликации идет речь. далеко не все можно эффективно кластеризовать

dyasny ★★★★★
(10.03.13 22:56:34 MSK)

Ссылка

man heartbeat, ipvs, cloudstack.

tazhate ★★★★★
(11.03.13 01:43:25 MSK)

https://alteeve.ca/w/2-Node_Red_Hat_KVM_Cluster_Tutorial

Deleted
(12.03.13 15:33:42 MSK)

Ссылка

Ответ на: комментарий от tazhate 11.03.13 01:43:25 MSK

добавлю еще в список xen и kemari. это такой vmware FT только opensource. Правда год назад, когда я его тыкал он не очень то работал, может чего и поменялось с тех пор. народ там активно смотрел в сторону infiniband

koshk0der
(15.03.13 12:22:22 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Новомодный оркестратор: Archipel

Admin

arch+systemd поднять сеть и ssh до монтирования шифрованных томов →

Похожие темы