Estou testando usando o script OCF: Heartbeat: Dummy e quero fazer uma configuração muito básica apenas para saber se funciona e se baseia nisso.
A única informação que posso encontrar foi este blogue aqui. link
Ele tem alguns erros de digitação, mas basicamente funcionou para mim.
O script atualmente contém apenas o seguinte:
sudo nano /usr/local/bin/failover.sh && sudo chmod +x /usr/local/bin/failover.sh
#!/bin/sh
touch /tmp/testfailover.sh
Aqui está minha configuração:
cp /usr/lib/ocf/resource.d/heartbeat/Dummy /usr/lib/ocf/resource.d/heartbeat/FailOverScript
sudo nano /usr/lib/ocf/resource.d/heartbeat/FailOverScript
dummy_start() {
dummy_monitor
/usr/local/bin/failover.sh
if [ $? = $OCF_SUCCESS ]; then
return $OCF_SUCCESS
fi
touch ${OCF_RESKEY_state}
}
sed -i 's/Dummy/FailOverScript/g' /usr/lib/ocf/resource.d/heartbeat/FailOverScript
sed -i 's/dummy/FailOverScript/g' /usr/lib/ocf/resource.d/heartbeat/FailOverScript
pcs resource create FailOverScript ocf:heartbeat:FailOverScript op monitor interval="30"
O único teste que posso realmente fazer:
[root@node2 ~]# /usr/lib/ocf/resource.d/heartbeat/FailOverScript start ; echo $?
DEBUG: default start : 0
0
O ocf-tester parece não existir na última versão do HA Software Suite, não tendo certeza de como instalá-lo manualmente, mas o script "meio funciona".
O script não precisa de monitoramento, é suposto ser muito básico, mas parece estar agitando e me dando o seguinte código de erro. Alguma ideia é o que fazer?
FailOverScript (ocf::heartbeat:FailOverScript): Started
node2
Failed Actions:
* FailOverScript_monitor_30000 on node2 'not running' (7): call=
24423, status=complete, exitreason='none',
last-rc-change='Tue Aug 16 15:53:50 2016', queued=0ms, exec=
9ms
Exemplo do que eu quero fazer:
Início do cluster
Script executa "start.sh"
O cluster falha no nó2.
No script node1, é executado "fail.sh"
No script node2, é executado "start.sh"
e vis-versa se falhar na outra direção.
Nota: O script funciona, recebo /tmp/testfailover.sh. Eu até tentei colocar outro script em dummy_stop para remover o arquivo e isso funcionou, mas ele apenas continua agitando ao remover / adicionar / remover / adicionar arquivo e iniciar / falhar / parar / iniciar etc etc.
Obrigado pela leitura!