A maior parte da pilha de software que o Google usa em seus servidores foi desenvolvida internamente. Para diminuir os efeitos de uma falha de hardware inevitável, o software foi projetado para ser tolerante a falhas.
Fonte: Google Platform
Depois de ler o artigo, acredito que seja o mesmo conceito de equilibrar a carga entre alguns servidores dimensionados para mais de 1.000 servidores, usando a pilha interna de software desenvolvida internamente no Linux. Por exemplo, GFS (sistema de arquivos do Google), BigTable - Sistema de armazenamento estruturado com base no GFS
Este link descreve como eles equilibram a carga de rede.
Eles usam Interruptores de balanceamento de carga para distribuir a carga. Todas as solicitações para o site chegam a uma máquina que passa a solicitação para um dos servidores disponíveis. O switch pode descobrir a partir dos servidores qual deles é o menos carregado, portanto, todos eles estão fazendo uma quantidade igual de trabalho.
A topologia de rede do Google é a seguinte:
Quando um computador cliente tenta se conectar ao Google, vários servidores DNS resolvem www.google.com em vários endereços IP por meio da política Round Robin. Além disso, isso funciona como o primeiro nível de balanceamento de carga e direciona o cliente para diferentes clusters do Google. Um cluster do Google tem milhares de servidores e, depois que o cliente se conecta ao servidor, é feito um balanceamento de carga adicional para enviar as consultas ao servidor da Web menos carregado.