Lastly, why would clients not by default question the next name server in the list when one is down?
Isso é exatamente o que os servidores recursivos fazem quando falam com servidores autoritativos. RFC 1035 §7.2 descreve o processo geral se você estiver interessado, mas os trechos a seguir são os mais imediatos relevante:
The key algorithm uses the state information of the request to select the next name server address to query, and also computes a timeout which will cause the next action should a response not arrive. The next action will usually be a transmission to some other server, but may be a temporary error to the client.
[snip]
- If a resolver gets a server error or other bizarre response from a name server, it should remove it from SLIST, and may wish to schedule an immediate transmission to the next candidate server address.
Existem alguns outros fatores considerados na seleção do servidor autoritativo, como o tempo de resposta observado com base no histórico de comunicação anterior. Está lá no RFC, se você estiver interessado.
A chave para garantir que você não seja afetado pela inacessibilidade do servidor de nomes é coberta pelo BCP 16 . Em particular, a Seção 3.1 declara:
Secondary servers must be placed at both topologically and geographically dispersed locations on the Internet, to minimise the likelihood of a single failure disabling all of them.
That is, secondary servers should be at geographically distant locations, so it is unlikely that events like power loss, etc, will disrupt all of them simultaneously. They should also be connected to the net via quite diverse paths. This means that the failure of any one link, or of routing within some segment of the network (such as a service provider) will not make all of the servers unreachable.
Isso é responsável pelo fato de que a resiliência do seu domínio é severamente afetada por pontos únicos de falha na rede ou no site físico. O estado ideal é ter vários servidores de nomes autoritativos que não sejam afetados por nenhuma alteração na rede ou estado físico experimentado pelos outros.