Quando fiz um teste de carga em um site que estou desenvolvendo, obtive 250 transações por segundo em uma conexão rápida com um computador rápido, de um servidor no mesmo data center obtive 2500 transações por segundo.
A latência é a resposta, como você disse. Apenas acrescenta tempo antes que o trabalho possa ser feito, portanto, o tempo de espera. A carga também será menor.
Você usou apenas uma conexão e fez dez solicitações (a simultaneidade é uma). Se sua latência for de 250 ms, você terá 2,5 segundos de tempo de espera testando a partir de uma conexão remota - talvez o dobro disso, pois os dados são bidirecionais. Se você tivesse apenas 5ms de latência, isso seria reduzido para 50ms, o que é imperceptível.
Se você quiser usar sua conexão completa para carregar o teste do seu sistema, precisará executar muitos testes em paralelo - 20, 50, talvez 1000. Isso está aumentando a simultaneidade. Em Siege, isso é feito como modo "benchmark" ou "teste de carga" - esqueço o nome exato.