Marcapasso - Corosync - HA - Teste de recurso personalizado simples - Flapping de status - Iniciado - Falhou - Parado - Iniciado

1

Estou testando usando o script OCF: Heartbeat: Dummy e quero fazer uma configuração muito básica apenas para saber se funciona e se baseia nisso.

A única informação que posso encontrar foi este blogue aqui. link

Ele tem alguns erros de digitação, mas basicamente funcionou para mim.

O script atualmente contém apenas o seguinte:

sudo nano /usr/local/bin/failover.sh && sudo chmod +x /usr/local/bin/failover.sh

#!/bin/sh

touch /tmp/testfailover.sh

Aqui está minha configuração:

cp /usr/lib/ocf/resource.d/heartbeat/Dummy /usr/lib/ocf/resource.d/heartbeat/FailOverScript

sudo nano /usr/lib/ocf/resource.d/heartbeat/FailOverScript

dummy_start() {
    dummy_monitor
    /usr/local/bin/failover.sh
    if [ $? =  $OCF_SUCCESS ]; then
    return $OCF_SUCCESS
    fi
    touch ${OCF_RESKEY_state}
}

sed -i 's/Dummy/FailOverScript/g' /usr/lib/ocf/resource.d/heartbeat/FailOverScript



sed -i 's/dummy/FailOverScript/g' /usr/lib/ocf/resource.d/heartbeat/FailOverScript

pcs resource create FailOverScript ocf:heartbeat:FailOverScript op monitor interval="30"

O único teste que posso realmente fazer:

[root@node2 ~]# /usr/lib/ocf/resource.d/heartbeat/FailOverScript start ; echo $?
DEBUG: default start : 0
0
O

ocf-tester parece não existir na última versão do HA Software Suite, não tendo certeza de como instalá-lo manualmente, mas o script "meio funciona".

O script não precisa de monitoramento, é suposto ser muito básico, mas parece estar agitando e me dando o seguinte código de erro. Alguma ideia é o que fazer?

FailOverScript (ocf::heartbeat:FailOverScript):        Started
node2

Failed Actions:
* FailOverScript_monitor_30000 on node2 'not running' (7): call=
24423, status=complete, exitreason='none',
    last-rc-change='Tue Aug 16 15:53:50 2016', queued=0ms, exec=
9ms

Exemplo do que eu quero fazer:

Início do cluster

Script executa "start.sh"

O cluster falha no nó2.

No script node1, é executado "fail.sh"

No script node2, é executado "start.sh"

e vis-versa se falhar na outra direção.

Nota: O script funciona, recebo /tmp/testfailover.sh. Eu até tentei colocar outro script em dummy_stop para remover o arquivo e isso funcionou, mas ele apenas continua agitando ao remover / adicionar / remover / adicionar arquivo e iniciar / falhar / parar / iniciar etc etc.

Obrigado pela leitura!

    
por FreeSoftwareServers 16.08.2016 / 21:56

0 respostas