Como sites como o Google conseguem alta disponibilidade? [fechadas]

7

Pelo que entendi, quando abro um site como o Google, o nome do host é consultado e meu navegador usa o endereço IP resultante para se conectar ao servidor e recuperar a página.

No entanto, como os sites de alta disponibilidade garantem que esse endereço IP único sempre possa ser alcançado? não é um único ponto de falha?

    
por Chris 13.09.2010 / 22:42

4 respostas

8

Existem duas soluções comuns para alta disponibilidade para sites: round robin de DNS e balanceamento de carga IP.

Round robin de DNS significa que você obtém endereços IP diferentes sempre que consultar um servidor DNS em busca do nome do site; isso ajuda a distribuir solicitações em vários servidores e também evita o ponto único de falha que você apontou. Esta é a resposta do DNS para www.google.com (quando solicitado a um dos servidores de nomes oficiais do domínio "google.com"):

> www.google.com
Server:  ns1.google.com
Address:  216.239.32.10

www.google.com  canonical name = www.l.google.com
www.l.google.com        internet address = 74.125.77.99
www.l.google.com        internet address = 74.125.77.104
www.l.google.com        internet address = 74.125.77.147

Outra solução comum, que poderia também ser usada ao mesmo tempo (e muito provavelmente neste caso), é o balanceamento de carga IP; ou seja, esses endereços IP não são realmente atribuídos a servidores, mas sim a dispositivos de balanceamento de carga (ou proxies reversos ou qualquer outra solução semelhante), que encaminham as solicitações para um dos vários servidores back-end; Se um desses servidores falhar, outro seria usado.

Mais informações aqui:

link
link

    
por 13.09.2010 / 22:55
1

Um endereço IP não é necessariamente um SPOF, pois certamente ele pode ser afetado dinamicamente (por exemplo, failover) para um servidor em bom estado, se o anterior não der certo.

    
por 13.09.2010 / 23:02
1

O Google provavelmente usa TRÊS abordagens ao mesmo tempo:

  • No back-end, você tem vários servidores para atender às solicitações. Eles têm seus próprios endereços IP.
  • Na frente deles, estão os balanceadores de carga de hardware que distribuem reuqests para os servidores por trás deles. Eles têm um IP público cada, mas podem cobrir 30, 60 ou até mais servidores físicos. Eles são provavelmente redundantes de um grande fabricante.
  • Na frente DNS Round Robin é provavelmente usado. Permite a atribuição de carga a ainda mais balanceadores de carga.

Na verdade, tudo isso é bem descrito.

link

Note que falamos de CENTENAS DE MILHARES DE SERVIDORES. MUITOS datacenters cheios de coisas.

O Google é muito especial, pois os servidores são praticamente somente leitura. Eles obtêm uma cópia do índice e veiculam isso até que sejam recriados com uma nova cópia atualizada. Nenhuma atualização é feita em um cluster de resposta. Isso é incomum para um aplicativo - mas não porque o Google é inteligente, apenas porque seus requisitos são incomuns.

    
por 14.09.2010 / 00:29
0

Os sites de alta disponibilidade usam muitas tecnologias, da mesma forma que os servidores de raízes DNS, da maneira a ser alcançada a qualquer momento.

No fato de estar seguro contra ataques e falhas, podemos implantar muitas soluções como:

  • Soluções Anycast
  • balanceamento de carga DNS
  • Balanceamento de carga e proxy reverso.
  • Soluções de failover
por 14.09.2010 / 02:51