Bem, tecnicamente isso é o que é round-robin - enviar cada conexão para um servidor diferente em ordem seqüencial.
O que você está se referindo é geralmente chamado de persistência ou viscosidade, e o balanceador de carga EC2 pode conseguir isso inserindo cookies no fluxo HTTP. Ele pode gerar seus próprios cookies e, em seguida, verificar o valor nas solicitações subsequentes. Assim, o cookie pode dizer algo como "Servidor 1" e o balanceador de carga sabe enviar a conexão de volta ao servidor 1. Você também pode fazer uso de cookies de aplicativos existentes. Vejo: link
e
A desvantagem é que o cliente deve ter cookies ativados em seu navegador.