Eu tenho um problema estranho aqui. Configurei o Corosync e o Pacemaker, usei este guia como referência, mas improvisei um pouco na primeira vez que o fiz, já que estou fazendo isso para aprender, não seguindo instruções como um escravo. Mas como eu recebi esse erro estranho, eu inicializei um novo VPS para tentar novamente, desta vez seguindo as instruções como um escravo.
Aqui está o guia que eu segui, muito bom criado a partir de Mitchell Anicas na Digital Ocean: Como criar uma configuração HAProxy de alta disponibilidade com o Corosync, o Pacemaker e os IPs flutuantes no Ubuntu 14.04 | digitalocean.com
Os erros que recebi estão relacionados ao número de nós no cluster. Nas minhas configurações, eu especifiquei explicitamente para fazer cluster de dois nós.
SO: Ubuntu Xenial Xursus (16.04.4)
totem {
version: 2
cluster_name: lbcluster
transport: udpu
interface {
ringnumber: 0
bindnetaddr: primary's-privateIP
broadcast: yes
mcastport: 5405
}
}
quorum {
provider: corosync_votequorum
two_node: 1
}
nodelist {
node {
ring0_addr: primary's-privateIP
name: primary
nodeid: 1
}
node {
ring0_addr: secondary's-privateIP
name: secondary
nodeid: 2
}
}
logging {
to_logfile: yes
logfile: /var/log/corosync/corosync.log
to_syslog: yes
timestamp: on
}
Se eu executar sudo crm status
, a saída que receberei será assim.
Last updated: Fri Apr 13 15:31:47 2018 Last change: Fri Apr 13 14:08:42 2018 by root via cibadmin on secondary<br>
Stack: corosync<br>
Current DC: secondary (version 1.1.14-70404b0) - partition with quorum<br>
3 nodes and 0 resources configured
Online: [ primary secondary ]
OFFLINE: [ sh-ps-02 ]
Eu também corro sudo crm configure show
para mostrar a configuração:
node 1: primary<br>
node 2: secondary<br>
node 2130706433: sh-ps-02<br>
property cib-bootstrap-options: \<br>
have-watchdog=false \<br>
dc-version=1.1.14-70404b0 \<br>
cluster-infrastructure=corosync \<br>
cluster-name=debian \<br>
stonith-enabled=false \<br>
no-quorum-policy=ignore
Por que há um nó esquisito, com o nome do nó do segundo nó em execução, mas offline, mesmo que seja explicitamente dito que é um cluster de dois nós?
Adição 16. Abril de 2018:
Eu corri sudo corosync-cmapctl | grep members
para obter os membros do cluster, e não há nenhum vestígio desse membro de cluster estranho que está offline.
runtime.totem.pg.mrp.srp.members.1.config_version (u64) = 0
runtime.totem.pg.mrp.srp.members.1.ip (str) = r(0) ip(x.x.82.204)
runtime.totem.pg.mrp.srp.members.1.join_count (u32) = 3
runtime.totem.pg.mrp.srp.members.1.status (str) = joined
runtime.totem.pg.mrp.srp.members.2.config_version (u64) = 0
runtime.totem.pg.mrp.srp.members.2.ip (str) = r(0) ip(x.x.82.167)
runtime.totem.pg.mrp.srp.members.2.join_count (u32) = 1
runtime.totem.pg.mrp.srp.members.2.status (str) = joined