Como obter os nós DRBD fora do StandAlone do Estado da Conexão (e WFConnection)?

1

Minha configuração Debian 8.9 DRBD 8.4.3 de alguma forma entrou em um estado em que os dois nós não podem mais se conectar na rede. Eles devem replicar um único recurso r1 , mas imediatamente após drbdadm down r1; drbadm up r1 em ambos os nós, seu /proc/drbd descreve a situação da seguinte forma:

no 1º nó (o estado da conexão é WFConnection ou StandAlone ):

1: cs:WFConnection ro:Primary/Unknown ds:UpToDate/DUnknown C r-----
   ns:0 nr:0 dw:0 dr:912 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:20

no segundo nó:

1: cs:StandAlone ro:Secondary/Unknown ds:UpToDate/DUnknown   r-----
   ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:48

Os dois nós podem pingar uns aos outros pelos endereços IP citados em /etc/drbd.d/r1.res , e netstat mostra que ambos estão ouvindo na porta citada.

Como eu posso (diagnosticar e sair mais) dessa situação para que os dois nós possam se tornar Conectado e replicado novamente no DRBD?

BTW, em um nível mais alto de abstração, este problema atualmente se manifesta por systemctl start drbd nunca saindo, aparentemente porque fica preso em drbdadm wait-connect all (como sugerido por /lib/systemd/system/drbd.service ).

    
por rookie09 24.08.2017 / 10:33

1 resposta

4

A situação foi aparentemente causada por um caso de cérebro dividido.

Eu não tinha notado isso porque eu tinha inspecionado apenas entradas de diário recentes para drbd.service ( sudo journalctl -u drbd ), mas o problema aparentemente foi relatado em outros logs do kernel e um pouco mais cedo ( sudo journalctl | grep Split-Brain ).

Com isso, resolvendo manualmente o cérebro dividido (como descrito aqui ou aqui ) também resolveu situação incômoda da seguinte forma.

Na vítima de cérebro dividido (supondo que o recurso DRBD seja r1 ):

drbdadm disconnect r1
drbdadm secondary r1
drbdadm connect --discard-my-data r1

Em sobrevivente de cérebro dividido:

drbdadm disconnect r1
drbdadm primary r1
drbdadm connect r1
    
por 24.08.2017 / 11:05