Faça uma imagem do seu ciclo de solicitação / resposta para o aplicativo e isole o gargalo. Você está certo de que um único proxy que distribui carga para muitos servidores de aplicativos exigirá a largura de banda agregada de todos os servidores de aplicativos. A solução clássica é o DNS RR. Google, Yahoo e Amazon usam essa técnica com um curto TTL. Eu fiz alguma investigação há algum tempo e documentou minhas descobertas .
Outra solução é usar uma solução de balanceamento de carga corporativa sofisticada usando endereçamento IP virtual para balancear solicitações entre vários servidores de aplicativos com endereços IP reais. Eu trabalhei com produtos Netscaler e Stonesoft. Ambos têm bom desempenho, mas têm terríveis idiossincrasias e são bastante complexos.