Encontrar a fonte desse tipo de problema pode ser extremamente frustrante, especialmente se forem raras. No entanto, é assim que eu me aproximo dos problemas de rede intermitentes
- Mapeie a rede com o melhor de sua capacidade
- Identifique sistemas potencialmente problemáticos
- Crie uma solução de monitoramento (de preferência automatizada) para identificar onde o problema está localizado
- Lide com o problema.
Os passos 1 e 2 devem ser relativamente diretos. Um desenho em um quadro branco com o caminho completo e os sistemas envolvidos é útil. Para o passo 3, costumo usar o Nagios ou outras soluções de monitoramento de longo prazo. Existem muitos plugins para nagios que podem ser úteis, e você pode configurá-lo para monitorar muitas propriedades dos sistemas com uma resolução muito alta do seu NOC. O monitoramento tem dois propósitos. Uma delas é coletar informações para posterior depuração, mas também informa sobre problemas que permitem correlacioná-las mais facilmente a fontes. Quando se trata de problemas de conectividade de rede intermitentes, certifico-me de configurar os testes de monitoramento e conectividade de roteamento para todos os sistemas ao longo do caminho.
Depois de encontrar uma solução para o problema, implemente-a e deixe o monitoramento no local até ter certeza de que o problema foi resolvido.
A propósito, equipamentos não gerenciados não têm lugar em uma rede de produção, como você provavelmente já descobriu. Depurar problemas em uma LAN sem acesso a pelo menos SNMP nos switches é uma enorme dor de cabeça. E se você não tiver sorte, um único patch entre duas portas de rede em algum lugar da rede é suficiente para fazer com que sua rede falhe e queime ...