LINUX.ORG.RU
ФорумAdmin

Proxmox и quorum

 , ,


0

1

Короче. Есть 3 сервера.

Смысл в том что 2 phoenix i sparrow нормально работают, а вот blackcap ни в какую не синкает. В чём может быть проблема ? С меня пиво.

root@blackcap:~# pvecm nodes
Node  Sts   Inc   Joined               Name
   1   M  2878936   2015-06-16 18:14:43  blackcap
   4   X      0                        phoenix
   5   X      0                        sparrow

root@blackcap:~# tail -f /var/log/syslog
Jun 16 18:16:03 blackcap corosync[212860]:   [CLM   ] Members Left:
Jun 16 18:16:03 blackcap corosync[212860]:   [CLM   ] Members Joined:
Jun 16 18:16:03 blackcap corosync[212860]:   [CLM   ] CLM CONFIGURATION CHANGE
Jun 16 18:16:03 blackcap corosync[212860]:   [CLM   ] New Configuration:
Jun 16 18:16:03 blackcap corosync[212860]:   [CLM   ] #011r(0) ip(192.168.30.58)
Jun 16 18:16:03 blackcap corosync[212860]:   [CLM   ] Members Left:
Jun 16 18:16:03 blackcap corosync[212860]:   [CLM   ] Members Joined:
Jun 16 18:16:03 blackcap corosync[212860]:   [TOTEM ] A processor joined or left the membership and a new membership was formed.
Jun 16 18:16:03 blackcap corosync[212860]:   [CPG   ] chosen downlist: sender r(0) ip(192.168.30.58) ; members(old:1 left:0)
Jun 16 18:16:03 blackcap corosync[212860]:   [MAIN  ] Completed service synchronization, ready to provide service.

root@phoenix:~# pvecm nodes
Node  Sts   Inc   Joined               Name
   1   X      0                        blackcap
   4   M  2621688   2015-06-16 17:21:11  phoenix
   5   X  2621700                        sparrow
root@phoenix:~# cat /etc/pve/cluster.conf
<?xml version="1.0"?>
<cluster name="birds1" config_version="9">

  <cman keyfile="/var/lib/pve-cluster/corosync.authkey">
  </cman>

  <clusternodes>


  <clusternode name="phoenix" votes="1" nodeid="4"/>
  <clusternode name="sparrow" votes="1" nodeid="5"/>
<clusternode name="blackcap" votes="1" nodeid="1"/></clusternodes>

</cluster>

Подскажите, какого нода не ловит quorum?


В последнее время не обновлялся? Когда проблемы начались? Такая ситуация была с неудачным апгредом до 3.4-2 что-ли, там ядро было бракованное. Что вело к полному развалу кластера.

stave ★★★★★
()
Ответ на: комментарий от stave

Там по идее удалили одну ноду (4ю) и после этого начались проблемы. Не могу вообще солюшена найти. Никакого. Уже на что хочешь грешил. И мультикаст в дц дёргал и ноду удалял и добавлял снова. Тут Мистика, я просто не могу придумать что могло случится. Т.к. как обычно ни на форумах прокса ничего не нашел, не на SO. Даже не знаю кому вопрос еще задать, т.к. этот проксмокс с каждой обновой походит на отечественный автопром.

blackcap pve-manager/3.4-1/3f2d890e (running kernel: 2.6.32-37-pve) cman_tool 1364188437 (built Mar 25 2013 06:14:00)

phoenix pve-manager/3.4-1/3f2d890e (running kernel: 2.6.32-37-pve) cman_tool 1364188437 (built Mar 25 2013 06:14:00)

sparrow pve-manager/3.4-1/3f2d890e (running kernel: 2.6.32-37-pve) cman_tool 1364188437 (built Mar 25 2013 06:14:00)

я что заметил что у них разный INC в pvecm nodes

blackcap

Node  Sts   Inc   Joined               Name
   1   M  2902144   2015-06-17 15:43:33  blackcap
   4   X      0                        phoenix
   5   X      0                        sparrow
phoenix и sparrow
Node  Sts   Inc   Joined               Name
   1   X      0                        blackcap
   4   M  2621812   2015-06-17 15:43:22  phoenix
   5   M  2621812   2015-06-17 15:43:22  sparrow

travka
() автор топика
Ответ на: комментарий от travka

РХ говорит, что

Inc is the cluster incarnation number at the time the node joined. It's a totally pointless piece of information that I think we'll remove in future releases

stave ★★★★★
()
Ответ на: комментарий от stave

Мне нужно было что бы нода осталась живая, без переустановки системы.

Да, делал по мануалу. Стопнул сервисы, сделал бекап, удалил с кластера, в локал моде восстановил с бекапа рестартнул сервисы и добавил обратно ноду - результата нет.

travka
() автор топика
Ответ на: комментарий от stave

If you power on that node as it is, your cluster will be screwed up and it could be difficult to restore a clean cluster state.

т.е. windows like ? Чуть что, переустановить ?

travka
() автор топика
Ответ на: комментарий от travka

т.е. windows like ? Чуть что, переустановить ?

Скорее всего да. Можешь посмотреть еще потроха с cmon редхатовским. У меня развлечения так же закончились. Но если ноды не трогать, то работает стабильно, на данный момент кластеру из 4ех нод больше 1,5 лет .

stave ★★★★★
()
Ответ на: комментарий от stave

Там проблема в cman'е и pve-cluster. Один непонятно какого не ловит quorum, другой непонятно почему не обновляет конфиги при старой версии. У нас в продакшне 3х 4х кластеров тьма. И как обычно, горьким опытом наученные, никто не трогает вообще конфиги этого жалкого велосипеда. Но оно всё равно умудряеться навернутся где то.

travka
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.