Parece que você está limitado pelo limite máximo de ARRs. Você pode testar alterando o algoritmo de balanceamento de carga para um peso diferente e ver se a soma dos dois nós ainda é 5000. Isso confirmará que ARR é o gargalo.
Como estão os recursos no servidor ARR? Aposto que eles são bons, nesse caso é apenas uma questão de mudar as configurações. Parece que a ARR está fazendo um bom trabalho para você.
O seu limite de configuração é provavelmente system.webServer / serverRuntime appConcurrentRequestLimit que tem um valor padrão de 5000. Como você tem a necessidade legítima de aumentá-lo, pode configurá-lo para algo muito mais alto no (s) servidor (es) ARR. p>