Mais dados:
Problemas intermitentes são difíceis. A primeira coisa que você precisa é isolar o problema - e para isso você precisa de dados :
- Registra todos os dispositivos, incluindo registros de tráfego.
- CPU, taxa de transferência de rede e descartes de pacotes e uso de memória para todos os dispositivos.
- Uma captura de pacote durante o tráfego normal e, depois, durante o problema, se você conseguir obter um.
Depois de ter todos esses dados, você precisa tentar correlacionar os eventos com algo que está acontecendo com esses dados coletados.
Ou, apenas adivinhe:
A outra rota que você pode tomar é apenas para começar a substituir coisas ou simplificar a situação. Com este método, você pega seu melhor palpite e o substitui. Você diz que reiniciar o balanceador de carga parece corrigir esse problema e que às vezes é a LAN e, às vezes, a WAN. Isso aponta para o balanceador de carga, de modo que seria um lugar lógico para iniciar. Você pode obter muita milhagem do HAProxy executado em uma caixa de mercadoria para balanceamento de carga (por exemplo, servidor Linux genérico) - Então, você pode tentar isso.
Além disso, você pode verificar se há atualizações ou abrir um tíquete de suporte com o fabricante do balanceador de carga.