A questão aqui é o próprio ELB. Algum tempo atrás, fizemos alguns testes de desempenho e descobrimos que o ELB começa a ter grande latência quando há mais de 250 solicitações / segundo. Descobrimos isso quando testamos o ELB, em seguida, fizemos esses testes contra uma das instâncias por trás do ELB - a instância (um tipo de instância m1.large) estava indo bem (embora tivesse alguma carga) com 250 solicitações / segundo, enquanto o ELB com alguns exemplos atrás estava morrendo. Ao mesmo tempo, ao testar o ELB, as instâncias tinham pouca carga.
Minha sugestão é obter uma instância que funcionará como um ballancer de carga (configure o nginx nele de preferência para isso) para as outras instâncias e não use nenhum ELB.