Monitoramento redundante com Nagios

2

Estou trabalhando com o Nagios 4.0.7 em dois servidores para monitorar minha rede. Recentemente eu desenvolvi o terceiro para ter mais redundância, então comecei a ler informações sobre redundância de failover principalmente com o NSCA. Alguém tem um pouco de experiência neste domínio que poderia me dizer qual é a maneira mais eficiente e fácil de fazer isso. Eu li esses slides que já me ajudaram muito, mas é claro que a questão ainda é a sincronização de tempo entre o mestre e os escravos:

link

A NSCA é a melhor opção? O failover, a redundância ou o uso de ambas as melhores opções?

    
por Javier Suárez 31.07.2014 / 11:31

1 resposta

1

Existe uma ótima documentação disponível sobre as configurações do Mestre / Escravo do Nagions no link

No meu caso de uso, usei uma abordagem ligeiramente diferente que achei mais fácil de configurar e recuperar no caso de uma falha. No CD 1, há uma VM rodando o Nagios que verifica tudo no DC 1 & 2. Ele é configurado usando o DRBD para replicar para uma VM em espera ativa e também um terceiro escravo no DC 2. O motivo pelo qual usei o DRBD é porque ele replica todo o dispositivo de bloco (mesmo em datacenters via VPN), de modo que a recuperação é rápida. Ele também tornou a configuração realmente simples e não exigiu uma configuração complicada no Nagios. Há várias maneiras de automatizar o failover de um nó inativo, como keepalived, corosync, heartbeat, se desejar totalmente automatizado.

No CD 2, temos exatamente a mesma configuração, apenas o inverso.

Meu ambiente não é tão grande (450 servidores), então essa configuração funcionou bem. Em ambientes muito maiores, pode ser necessário distribuir o monitoramento nos nós do Nagios para atingir metas de desempenho aceitáveis.

    
por 31.07.2014 / 16:49

Tags