Concordo com @suprjami e gostaria de oferecer essa possível avenida de exploração: em vez de os discos do servidor serem muito lentos , considere que eles podem estar falhando (congelamentos típicos de discos rígidos por cerca de 8 segundos por clusters defeituosos lidos), severamente fragmentados, ficando sem espaço (causando fragmentação severa e muita movimentação de discos), ou você pode ter uma tarefa sobrecarregada com a CPU ou ligada a disco na máquina, deixando todo o resto sem rede, incluindo rede e disco. subsistemas. Eu recomendo verificar o Visualizador de Eventos do servidor para erros de disco e puxar o Gerenciador de Tarefas ou o Process Explorer com algumas colunas para mostrar falhas de página, uso da CPU e bytes de leitura e escrita e ver o que os números estão fazendo.
Dado que ZeroWindow é um sintoma do buffer de recebimento TCP estar cheio, estou disposto a apostar que o problema é algo que consome 100% da CPU no servidor ou algo que causa tráfego de rede excessivamente excessivo no servidor e bloqueia tudo.
Uma outra possibilidade é bufferbloat na implementação TCP de um dispositivo intermediário, se esse dispositivo estiver modificando os pacotes que ele transmite de alguma forma (ou seja, NAT). As suas transferências aumentam e diminuem na taxa de transferência, por acaso?