Ferramenta (s) de monitoramento de rede apropriada para registrar soluços [fechados]

3

Eu tenho um cliente que tem problemas com o nosso software que falha de tempos em tempos. Infelizmente, se você desconectar o cabo de rede no meio de uma transação, o nosso software irá travar toda vez e não há nada que possa ser feito (ou pelo menos nada que seja) sobre isso.

Eu acredito que a rede deles está passando por soluços de tempos em tempos que estão causando o travamento do software, mas não tenho certeza de como prová-lo (meu histórico é programação e bancos de dados, mas não muita rede).

Quando faço ping de qualquer uma das máquinas clientes do servidor, todas elas respondem em menos de um milissegundo, mas sempre que falha, encontramos algum tipo de mensagem de erro no log de eventos sobre a perda de conexão com um arquivo (desculpe, eu sei isso é muito vago, mas eu ainda não fui ao site e a pessoa que foi não escreveu).

Eu realmente não tenho certeza sobre como fazer um teste para algo parecido com isso para saber que tipo de ferramentas de rede eu deveria procurar. Se alguém pudesse me apontar na direção certa, eu agradeceria muito!

    
por BVernon 06.08.2013 / 00:46

2 respostas

3

O Smokeping é uma ferramenta de monitoramento bastante engenhosa, se você estiver interessado em perda de pacotes e latência.

Se isso não se encaixa na fatura, esta pergunta pode ter algumas respostas que lhe interessam.

Para ser claro: esse tipo de problema pode ser extremamente frustrante para solucionar problemas. É altamente provável que as ferramentas de monitoramento não forneçam informações úteis. A ferramenta mais provável que você deve considerar empregar para rastrear isso é a captura de pacotes. Pegue um no cliente e no servidor e, em seguida, correlacione os timestamps com quando o aplicativo do cliente falhar e possivelmente com os dados do Smokeping (ou qualquer outra ferramenta de monitoramento escolhida).

    
por 06.08.2013 / 01:17
0

Se a máquina cliente em questão estiver em um switch gerenciado decente, um engenheiro de rede deve ser capaz de informar se a porta de rede da máquina está funcionando. Cabos danificados, NIC's flakey, portas defeituosas no switch, problemas de driver, tudo poderia fazer com que a própria porta da rede ficasse abafada.

Verifique os logs de eventos do Windows na máquina do cliente no horário em questão. Crie uma exibição personalizada no visualizador de eventos que contenha todos os logs de eventos com um período de tempo personalizado ao redor da falha, o que permitirá que você veja tudo o que as janelas anotaram durante esse período de tempo.

Você pode configurar um ping do servidor para o cliente em um pequeno intervalo - por exemplo, duas vezes por segundo - e deixar que seja executado em segundo plano até que haja um problema. Registre a saída em um arquivo para não perder os resultados.

Se você tentar correlacionar logs em várias máquinas, verifique se os relógios estão relativamente sincronizados.

    
por 06.08.2013 / 03:51