É chamado escalabilidade horizontal (ou escalabilidade horizontal). Você não adiciona mais recursos ao seu sistema (escalabilidade vertical), adiciona mais máquinas ao seu sistema e faz o balanceamento de carga.
A vantagem é ser "elástico", ou seja, quando você é atingido por um alto tráfego, você implanta automaticamente mais máquinas para lidar com a carga e, em momentos em que o tráfego é pequeno, você remove as máquinas dele. Então você acaba tendo um custo menor no final. É por isso que os recursos da nuvem são cobrados de forma diferente (você paga o que usa, não o que você 'possui').
Esta é uma ótima palestra do arquiteto líder do Ebay falando sobre computação em nuvem como um todo e seus impactos. É grande, mas é GOLD para entender o que está acontecendo:)