Um sistema de failover baseado na atualização de informações no DNS não será bom o suficiente para cinco noves de disponibilidade.
O DNS TTL mais baixo em que geralmente se pode confiar é de 300 segundos. 0,001% de um ano é 315 segundos. Portanto, um sistema baseado em DNS pode ter no máximo um failover por ano antes de quebrar cinco noves. Não importa quão bem você construa sua infra-estrutura de DNS, já que essa é uma limitação baseada no comportamento geral dos clientes DNS, que você não pode alterar.
Eu sugiro que você comece a criar sua resiliência no nível do endereço IP, via anycast ou algo assim (não minha área de especialização, então não posso dar conselhos detalhados lá). Você ainda precisará de uma boa infra-estrutura de DNS, é claro, mas com dados DNS bastante estáticos, apenas a compra de um serviço padrão de um provedor de serviços de DNS respeitável será suficiente.