LINUX.ORG.RU
ФорумAdmin

cman & fence


0

1

Добрый день/вечер. Есть кластер под cman. В качестве fence стоит fence_imm (ибо IBM). Команды типа

fence_imm -A password -a 10.0.0.204 -p PASSW0RD -l USERID -o status
Getting status of IPMI:10.0.0.204...Chassis power = On Done

Конфиг кластера:

[root@node03 ~]# cat /etc/cluster/cluster.conf
<?xml version="1.0"?>
<cluster config_version="105" name="clustername">
        <clusternodes>
                <clusternode name="nn01" nodeid="1">
                        <fence>
                                <method name="fence_node01">
                                        <device name="IMMnn01"/>
                                </method>
                        </fence>
                </clusternode>
                <clusternode name="nn02" nodeid="2">
                        <fence>
                                <method name="fence_node02">
                                        <device name="IMMnn02"/>
                                </method>
                        </fence>
                </clusternode>
                <clusternode name="nn03" nodeid="3">
                        <fence>
                                <method name="fence_node03">
                                        <device name="IMMnn03"/>
                                </method>
                        </fence>
                </clusternode>
        </clusternodes>
        <rm status_poll_interval="5">
                <resources>
                        <script file="/etc/init.d/libvirtd" name="libvirtd"/>
                </resources>
        </rm>
        <logging logfile="/var/log/logname.log"/>
        <fencedevices>
                <fencedevice agent="fence_imm" auth="password" delay="5" ipaddr="10.0.0.202" login="USERID" name="IMMnn01" passwd="PASSW0RD" power_wait="20" timeout="20"/>
                <fencedevice agent="fence_imm" auth="password" delay="5" ipaddr="10.0.0.203" login="USERID" name="IMMnn02" passwd="PASSW0RD" power_wait="20" timeout="20"/>
                <fencedevice agent="fence_imm" auth="password" delay="5" ipaddr="10.0.0.204" login="USERID" name="IMMnn03" passwd="PASSW0RD" power_wait="20" timeout="20"/>
        </fencedevices>
</cluster>

Так вот проблема: когда бутаем/выключаем одну железку, кворум пересобирается и исключает её:

[root@node02 cluster]# fence_tool ls
fence domain
member count  2
victim count  0
victim now    0
master nodeid 1
wait state    none
members       1 2
[root@node02 cluster]# cman_tool status
Version: 6.2.0
Config Version: 105
Cluster Name: clustername
Cluster Id: 33146
Cluster Member: Yes
Cluster Generation: 2736
Membership state: Cluster-Member
Nodes: 2
Expected votes: 3
Total votes: 2
Node votes: 1
Quorum: 2
Active subsystems: 7
Flags:
Ports Bound: 0
Node name: nn02
Node ID: 2
Multicast addresses: 239.192.129.251
Node addresses: 10.100.100.2

Железка бутнулась и все. cman не стартует. Валится на «ожидании кворума». Но стоит только на одной из «живых» дернуть cman одновременно с «не живой», кворум собирается, cman стартует.

То-есть, fence отрабатывает. А вот unfence - нет :-)

Что не так сделано или это особенность этого fence метода?


Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.