query keepalived

1

* Nota: Eu tenho problemas para decidir o que deve ir no serverfault e o que deve ir no superusuário, se algum administrador gentilmente decidir que isso está no lugar errado, por favor mova-o para mim - muito obrigado.

Estou implementando um sistema HA básico com keepalived. Eu só quero ser notificado sobre o failover no caso de falha de hardware.

No entanto, os servidores trocam de função periodicamente. Eu tenho um track_script em execução no backup que irá variar o retorno entre 0 e 1 em um intervalo (uma vez por semana, uma vez por mês, seja qual for). Ao retornar 0, a prioridade é aumentada acima da do mestre, ao retornar 1, a prioridade é diminuída novamente. Desta forma, eles trocam de lugar no intervalo configurado.

A pergunta: O que posso fazer para dizer a diferença entre um switch causado pelo meu script e um switch causado porque um dos servidores morreu? Eu certamente quero ser notificado quando houver um problema real, mas não toda vez que os servidores mudarem de lugar por causa do script.

Eu vejo que a versão 1.2.7 tem suporte SNMP e eu posso usá-lo para obter algumas informações que poderiam me dizer de uma forma ou de outra, mas para ser honesto eu nunca usei snmp antes e eu não saber como obter as informações que quero com ele (meu Google foo falhou comigo).

    
por tdimmig 28.11.2012 / 23:31

1 resposta

0

Você pode fazer isso desativando a notificação por e-mail no keepalived e criando notify_master e notify_fault scripts que enviarão e-mails quando um servidor for promovido a um mestre ou se tiver uma falha.

O track_script pode tocar um arquivo para atualizar seu horário modificado quando ele faz a alternância "planejada" e os scripts notify_master e notify_fault podem ler o registro de data e hora desse arquivo (com stat -c %Y file ) e se timestamp é mais antigo que por exemplo 60 segundos, então era uma transição planejada e não envia um email, caso contrário, envie-a.

    
por 02.09.2013 / 01:37