Não é necessariamente uma peça de hardware que faz isso, mas sim um sistema completo que foi projetado para escalar. Isso não apenas engloba o hardware, mas, mais importante, o design do aplicativo, o design do banco de dados (relacional ou não), a rede, o armazenamento e como eles se encaixam.
Um bom ponto de partida para sua curiosidade em descobrir como alguns dos sites de grande escala são Alta escalabilidade - Comece aqui e Alta escalabilidade na arquitetura Wikimedia , Facebook e Twitter como exemplos.
Com relação à sua pergunta sobre DNS e endereços IP únicos e round-robin, esses tipos de sites geralmente usam balanceamento de carga como um método de apresentar um único endereço IP. Isso pode ser feito por balanceadores de carga de hardware especializados ou por meio de software executado em servidores de propósito geral. As solicitações recebidas para o IP gerenciado pelo balanceador de carga são distribuídas de forma transparente para o usuário final por uma série de servidores.
Para obter uma boa explicação sobre esse tópico, incluindo uma comparação de balanceadores de carga / proxies de hardware e software e como eles se comparam ao round-robin do DNS, leia o Balanceamento de carga de aplicativos da Web .