Número de nó estranho na configuração do balanceador de carga

1

Eu tenho um problema estranho aqui. Configurei o Corosync e o Pacemaker, usei este guia como referência, mas improvisei um pouco na primeira vez que o fiz, já que estou fazendo isso para aprender, não seguindo instruções como um escravo. Mas como eu recebi esse erro estranho, eu inicializei um novo VPS para tentar novamente, desta vez seguindo as instruções como um escravo.

Aqui está o guia que eu segui, muito bom criado a partir de Mitchell Anicas na Digital Ocean: Como criar uma configuração HAProxy de alta disponibilidade com o Corosync, o Pacemaker e os IPs flutuantes no Ubuntu 14.04 | digitalocean.com

Os erros que recebi estão relacionados ao número de nós no cluster. Nas minhas configurações, eu especifiquei explicitamente para fazer cluster de dois nós.

SO: Ubuntu Xenial Xursus (16.04.4)

totem {
  version: 2
  cluster_name: lbcluster
  transport: udpu
  interface {
    ringnumber: 0
    bindnetaddr: primary's-privateIP
    broadcast: yes
    mcastport: 5405
  }
}

quorum {
  provider: corosync_votequorum
  two_node: 1
}

nodelist {
  node {
    ring0_addr: primary's-privateIP
    name: primary
    nodeid: 1
  }
  node {
    ring0_addr: secondary's-privateIP
    name: secondary
    nodeid: 2
  }
}

logging {
  to_logfile: yes
  logfile: /var/log/corosync/corosync.log
  to_syslog: yes
  timestamp: on
}

Se eu executar sudo crm status , a saída que receberei será assim.

Last updated: Fri Apr 13 15:31:47 2018          Last change: Fri Apr 13 14:08:42 2018 by root via cibadmin on secondary<br>
Stack: corosync<br>
Current DC: secondary (version 1.1.14-70404b0) - partition with quorum<br>
3 nodes and 0 resources configured

Online: [ primary secondary ]
OFFLINE: [ sh-ps-02 ]

Eu também corro sudo crm configure show para mostrar a configuração:

node 1: primary<br>
node 2: secondary<br>
node 2130706433: sh-ps-02<br>
property cib-bootstrap-options: \<br>
have-watchdog=false \<br>
dc-version=1.1.14-70404b0 \<br>
cluster-infrastructure=corosync \<br>
cluster-name=debian \<br>
stonith-enabled=false \<br>
no-quorum-policy=ignore

Por que há um nó esquisito, com o nome do nó do segundo nó em execução, mas offline, mesmo que seja explicitamente dito que é um cluster de dois nós?

Adição 16. Abril de 2018: Eu corri sudo corosync-cmapctl | grep members para obter os membros do cluster, e não há nenhum vestígio desse membro de cluster estranho que está offline.

runtime.totem.pg.mrp.srp.members.1.config_version (u64) = 0
runtime.totem.pg.mrp.srp.members.1.ip (str) = r(0) ip(x.x.82.204)
runtime.totem.pg.mrp.srp.members.1.join_count (u32) = 3
runtime.totem.pg.mrp.srp.members.1.status (str) = joined
runtime.totem.pg.mrp.srp.members.2.config_version (u64) = 0
runtime.totem.pg.mrp.srp.members.2.ip (str) = r(0) ip(x.x.82.167)
runtime.totem.pg.mrp.srp.members.2.join_count (u32) = 1
runtime.totem.pg.mrp.srp.members.2.status (str) = joined
    
por StianM 13.04.2018 / 15:44

1 resposta

0

Acredito que o Xenial está enviando o Corosync e o Pacemaker iniciados e ativados no systemd, com uma configuração corosync.conf que traria um "cluster de nó único". Essa entrada é provavelmente o nome do host de um de seus nós que foi adicionado antes de você definir os nomes: primary e secondary .

Para limpá-lo, basta excluir essa entrada:

# crm node delete sh-ps-02

Nota: nomear seus nós primary e secondary não é uma ótima prática. node-a e node-b seriam melhores, já que qualquer nó no cluster deve ser capaz de atuar como "primário" ou "secundário".

    
por 16.04.2018 / 18:38