Sua situação é bastante semelhante à nossa. Queremos datacenters divididos e failover do tipo de camada de rede.
Se você tiver orçamento para isso, o que você deseja são dois datacenters, vários IP transits para cada um, um par de roteadores de borda fazendo sessões BGP para seus provedores de trânsito, anunciando seus endereços IP para a Internet global .
Esta é a única maneira de fazer o verdadeiro failover. Quando os roteadores percebem que a rota para seus servidores não é mais válida (o que você pode fazer de várias maneiras), eles param de anunciar essa rota e o tráfego vai para o outro site.
O problema é que, para um par de roteadores de borda, você está olhando para um custo bastante alto inicialmente para obter essa configuração.
Então você precisa configurar a rede por trás de tudo isso, e você pode querer considerar algum tipo de conectividade Layer2 entre seus sites como um link ponto-a-ponto para que você possa rotear o tráfego de entrada para um datacenter, diretamente para o outro em caso de falha parcial do seu site principal.
Práticas recomendadas BGP Multihomed / Multi-localização e Melhor forma de melhorar a resiliência? são perguntas que fiz sobre problemas semelhantes.
A página de vergonha do GSLB levanta alguns pontos importantes, e é por isso que, pessoalmente, eu nunca escolheria de bom grado um GSLB para fazer o trabalho de roteamento do BGP.
Você também deve olhar para os outros pontos de falha em sua rede. Certifique-se de que todos os servidores tenham 2 NICs (conectadas a 2 switches separados), 2 PSUs e que seu serviço seja composto de vários servidores de back-end, como pares redundantes ou clusters com balanceamento de carga.
Basicamente, o "balanceamento de carga" do DNS através de vários registros A é apenas "compartilhamento de carga", pois o servidor DNS não tem noção de quanto de carga há em cada servidor. Isso é barato (grátis).
Um serviço GSLB tem algum conceito de como os servidores estão carregados, e sua disponibilidade, além de oferecer maior resistência a falhas, mas ainda é atormentado pelos problemas relacionados ao cache de DNS e ao rastreio. Isso é menos barato, mas um pouco melhor.
Uma rede roteada BGP, apoiada por uma infraestrutura sólida, é IMHO, a única maneira de realmente garantir um bom tempo de atividade. Você poderia economizar algum dinheiro usando servidores de rota em vez de roteadores Cisco / Juniper / etc, mas no final do dia, você precisa gerenciar esses servidores com muito cuidado. Esta não é de forma alguma uma opção barata, ou algo a ser empreendido de ânimo leve, mas é uma solução muito gratificante, e traz você para a internet como um provedor, ao invés de apenas um consumidor.