Servidores espelhados em data centers em todo o país - como?

5

Servidores espelhados em data centers em todo o país - como milhões de usuários obtêm simultaneamente resultados instantâneos de suas solicitações "google.com"? Eu fui reprovado na minha entrevista de TI fazendo essa pergunta errada.

Pensei que nas várias áreas metropolitanas, uma solicitação " link " é enviada ao servidor DNS do ISP, que de alguma forma retorna um endereço IP para um de vários servidores http geograficamente próximos e, em seguida, algo é transferido internamente para o próximo servidor local disponível do Google. Mas não consegui explicar onde a tabela de servidores locais disponíveis do Google está armazenada, ou os detalhes da substituição do endereço IP. Ou como eles poderiam remover manualmente algum servidor da rotação, de qualquer lugar.

Então, o que eu deveria estar lendo agora para que eu possa fazer esta pergunta da próxima vez?

Além disso, que daemons são executados nessas máquinas 24 horas por dia, 7 dias por semana, para manter todos esses discos de banco de dados espelhados sincronizados?

    
por Sysadmin Evstar 08.01.2011 / 23:16

3 respostas

6

Estou misturado aqui. O que o google faz é o padrão anycast.

link

Basicamente, você tem seus próprios endereços de Internet, em seu próprio AS (um termo que um administrador de sistema deve saber) e, em seguida, atribui a todos os clusters os mesmos intervalos de IP (todos os data centers). O DNS irá arredondar o robin, mas você não o usa para direcionar para endereços específicos .... você usa anúncios anycast do bgp para isso. O que você precisa é o acesso ao nível de Internet gbp, que requer que você possua AS. O truque é que, se um DNS disser "endereço x", sua configuração anycast do DNS encaminhará todas as solicitações para o datacenter mais próximo.

Dito isso, não é um conhecimento padrão de um sysadmin nommal saber disso. Como você pode ver nas respostas erradas mais acima, que parecem não estar sequer ciente do Anycast, que é praticamente uma abordagem padrão. Os protocolos de roteamento de backbone de BGP / Internet não são algo que 99% dos administradores de rede tenham necessidade de saber. Nisso, a questão era injusta ou para um cargo sênior.

Also, what daemons run on these machines 24/7 to keep all those mirrored database disks synchronized?

Nenhum. Discos não são sincronizados. Para meu conhecimento, as máquinas do google são executadas em clusters de máquinas X cada (formando uma unidade funcional) e os censores não são atualizados nunca. Eles são regularmente reinstalados com uma imagem nova e atualizada. Entre as instalações, nenhuma sincronização acontece.

    
por 09.01.2011 / 00:04
3

Esta entrevista para uma posição de administrador de sistema? Se assim for, acho que a pergunta é um pouco injusta. Eu não conheço toda a extensão ou contexto da questão, e você definitivamente deve saber como componentes como DNS e balanceamento de carga funcionam em geral, mas não acho que você poderia saber como o Google (por exemplo) consegue fazer com que seus serviços sejam globalmente diversos e altamente disponíveis.

Servidores espelhados em data centers em todo o país? Isso poderia significar qualquer coisa.

O que precisa ser espelhado? Um website? Uma infra-estrutura de domínio do Windows? Um serviço de FTP? Etc., etc.

    
por 08.01.2011 / 23:50
1

Você pode querer analisar o equilíbrio de carga e os CDNs.

Não há um daemon específico que eu saiba. No entanto, existem várias maneiras de fazer isso.

Editar: E para responder ao seu comentário, o DNS não é o bilhete aqui. É tudo sobre CDNs (redes de distribuição de conteúdo) e balanceadores de carga, redirecionando para um número de hosts espelhados disponíveis. Esses hosts são espelhados por qualquer número de tecnologias, incluindo (provavelmente não no caso do Google) rsync e coisas dessa natureza.

    
por 08.01.2011 / 23:34