Existe uma ótima documentação disponível sobre as configurações do Mestre / Escravo do Nagions no link
No meu caso de uso, usei uma abordagem ligeiramente diferente que achei mais fácil de configurar e recuperar no caso de uma falha. No CD 1, há uma VM rodando o Nagios que verifica tudo no DC 1 & 2. Ele é configurado usando o DRBD para replicar para uma VM em espera ativa e também um terceiro escravo no DC 2. O motivo pelo qual usei o DRBD é porque ele replica todo o dispositivo de bloco (mesmo em datacenters via VPN), de modo que a recuperação é rápida. Ele também tornou a configuração realmente simples e não exigiu uma configuração complicada no Nagios. Há várias maneiras de automatizar o failover de um nó inativo, como keepalived, corosync, heartbeat, se desejar totalmente automatizado.
No CD 2, temos exatamente a mesma configuração, apenas o inverso.
Meu ambiente não é tão grande (450 servidores), então essa configuração funcionou bem. Em ambientes muito maiores, pode ser necessário distribuir o monitoramento nos nós do Nagios para atingir metas de desempenho aceitáveis.