Carregamos aplicativos testados com até 2,8 milhões de solicitações com uma latência média de menos de 100 ms. Com base nisso e no fato de que você está usando um número um pouco menor de solicitações, duvido que esteja sendo estrangulado.
Tendo dito isso, esta pergunta foi feita em 2009 (mais de 2 anos atrás, no momento em que escrevemos), então é bem possível que a AWS estivesse fazendo as coisas de maneira diferente naquela época.