Isso começou como um comentário ... mas está ficando muito longo.
Infelizmente, a maioria das respostas a pergunta anterior está errada: elas Suponha que o failover tenha algo a ver com o TTL. A resposta mais votada é ESPETAMENTE errada, e notadamente não cita fontes. O TTL se aplica ao registro da zona como um todo e não tem nada a ver com o Round Robin.
A partir do RFC 1794 (que é tudo sobre o serviço de Round Robin DNS )
There is no use in handing out information with TTLs of an hour [or less]
(IME está mais perto de 3 horas antes de você obter a propagação completa).
Do RFC 1035
When several RRs of the same type are available for a
particular owner name, the resolver should either cache them
all or none at all
A RFC 1034 estabelece os requisitos para o armazenamento em cache negativo - um método para indicar que todas as solicitações devem ser atendidas no servidor DNS autoritativo (nesse caso, o TTL controla o failover) - na minha experiência, o suporte a isso varia.
Como qualquer failover teria que ser implementado no topo da pilha de clientes, é indiscutivelmente parte do TCP / IP ou DNS - de fato, SIP, SMTP, RADIUS e outros protocolos executando no topo do TCP / IP define como o cliente deve trabalhar com Round Robin - RFC 2616 (HTTP / 1.1) é notável em não mencionar como deve se comportar.
No entanto, na minha experiência, cada navegador e a maioria dos outros clientes HTTP escritos nos últimos 10 anos irão verificar de forma transparente os RRs adicionais se a conexão parecer demorar mais do que o esperado. E não sou só eu:
Os tempos de failover variam de acordo com a implementação, mas estão na região em segundos. Não é uma solução ideal, pois (devido aos limites do DNS) a publicação de um nó com falha leva o DNS TTL - enquanto isso, você precisa confiar na detecção do lado do cliente.
Round-Robin não é um substituto para outros mecanismos de HA dentro de um site. Mas ele complementa (os caras que escreveram o HAProxy recomendam usar um par de instalações acessadas via round robin DNS). É o melhor mecanismo suportado para implementar o HA em vários sites: na verdade, até onde posso determinar, é o único mecanismo de suporte suportado por failover disponível em clientes padrão.