Isso provavelmente depende de suas próprias necessidades e se você quer apenas saber se fica lento ou se você também quer ter algum conhecimento sobre qual "pressão" é necessária para que seu servidor entre em colapso.
Você precisa definir quanto de simultaneidade precisa ser manipulado e, portanto, quantas solicitações precisam ser atendidas no carregamento normal.
Eu verificaria o desempenho do nível base do seu aplicativo para obter algumas informações:
- Média de tempos de resposta em carga baixa / média / alta
- Escalonamento de tempos de resposta com concorrência adicional
Após determinar seu nível básico, você pode começar a colocar carga em seus servidores para ver como os tempos de resposta mudam.
Eu diria que os tempos de resposta do seu aplicativo serão escalonados primeiro e serão convergidos para um dado throughput antes de permanecer lá por um tempo antes do throughput do benchmark que você está usando para simular seus collapses reais de base de usuários. / p>
Para simular sua base de usuários, você pode usar uma ferramenta como gobench .