É possível evitar completamente um único ponto de falha em um backend da web?

2

Parece que você está sempre dependente de algum provedor de hospedagem disponível. Mesmo se os servidores forem geo-redundantes nos datacenters, você ainda terá um registro DNS que aponta para algum endereço IP e será resolvido por algum servidor DNS que pode desaparecer a qualquer segundo. Existe uma solução para isso? Eu vi pessoas sugerirem balanceamento de carga DNS com algum mecanismo para detectar o tempo de inatividade e fazer o failover. Qual provedor DNS oferece isso? E ainda se baseia em um dos centros de dados que não está sendo desativado?

Assumindo que tudo por trás de nossa primeira linha de contato (proxy LB) já é geo-redundante - existe realmente uma maneira viável de cuidar dessa última etapa?

    
por Assaf Lavie 22.05.2011 / 07:25

2 respostas

3

Na verdade, pode haver vários servidores DNS servindo um determinado domínio, veja o domínio stackoverflow.com:

$ nslookup -type=ns stackoverflow.com
Server:     192.168.0.1
Address:    192.168.0.1#53

Non-authoritative answer:
stackoverflow.com   nameserver = ns3.serverfault.com.
stackoverflow.com   nameserver = ns1.serverfault.com.
stackoverflow.com   nameserver = ns2.serverfault.com.

Authoritative answers can be found from:

$

Os nomes de domínio em stackoverflow.com podem ser resolvidos por três servidores de nomes, portanto, mesmo que um ou dois deles tenham sido desativados, os nomes de domínio ainda poderão ser resolvidos.

    
por 22.05.2011 / 07:36
2

Os RFCs que fazem recomendações para servidores DNS sugerem usar pelo menos três servidores de nomes colocados em locais logicamente e geograficamente diversos para evitar exatamente esse problema. Os endereços IP publicados para esses servidores também podem ser configurados com IP anycast, para que os servidores em vários locais possam compartilhar o mesmo endereço IP. O roteamento em torno de falhas é praticamente automático quando o roteamento adequado é usado (ou seja, um local que está vinculado a esse IP diminui e o tráfego é simplesmente direcionado para outro automaticamente). Os servidores DNS raiz e muitos dos principais TLDs são configurados dessa forma para resistir a falhas e resistir a ataques DDoS. É como os serviços, como o OpenDNS, têm quase 100% de tempo de atividade, mesmo ao servir bilhões de consultas.

As empresas gastaram milhões de dólares em infraestrutura redundante para reduzir o tempo de inatividade, mas falhas ainda podem acontecer, muitas vezes de formas inesperadas relacionadas aos fatores humanos envolvidos, e não aos fatores tecnológicos.

    
por 22.05.2011 / 07:55