Qual é o “caminho certo” para monitorar a rede?

2

Meus servidores de produção são mantidos na costa leste dos EUA e alguns dos aplicativos de suporte são mantidos em Amsterdã, na Europa. Há uma instância do Nagios rodando na costa leste dos EUA, o que faz algumas verificações de porta e algumas verificações via ssh.

O problema é que quase todos os dias observo quedas de pacotes usando mtr (combinação de traceroute e ping), bem como pequenos problemas de serviço que duram cerca de 1 minuto. Mostrei esses resultados mtr para o nosso provedor de serviços em Amsterdã, mas ele negou qualquer problema dizendo que o ICMP (usado por mtr) não é uma forma confiável de medir as quedas, já que o ICMP tem a menor prioridade nos roteadores. Portanto, os roteadores podem descartar o ICMP, mas estarão bem para o TCP.

Como posso provar isso ao meu provedor de serviços de que há realmente um problema com o serviço dele e ele precisa corrigi-lo? Quais são as ferramentas e técnicas certas para isso?

    
por Aditya Patawari 28.02.2014 / 08:05

3 respostas

2

É difícil provar definitivamente a perda de pacotes.

Se esse é o seu objetivo, minha estratégia recomendada seria:

  • configure o host A e o host B para testar a rede entre
  • implemente a regra iptables em cada host para contar o número de pacotes que entram / saem
    • isso significa que NÃO há regra de rastreamento com monitoração
  • use iperf para fazer um teste TCP por um período, por exemplo 300 segundos
  • despeje o iptables nos dois hosts e compare as contagens de pacotes

Uma alternativa ao uso de iptables é observar as contagens de pacotes tx / rx de sua interface em ambos os hosts (por exemplo, ifconfig eth0 ) - anote no início do seu teste, faça seu teste de transferência SCP ou FTP) - e então calcular se os pacotes enviados de um host são iguais aos pacotes recebidos no outro host.

Qualquer outra técnica lhe dará informações falsas. É verdade que hosts e roteadores intermediários tratarão ICMP com baixa prioridade ou talvez não respondam a ela. Freqüentemente, UDP pacotes também são tratados como prioridade mais baixa, portanto, um teste iperf controlado usando um fluxo UDP pode dar resultados falsos. E um teste TCP sem realmente contar os pacotes enviados e os pacotes recebidos nunca revelará muito, já que o sistema operacional subjacente lida com a perda de pacotes.

    
por 28.02.2014 / 09:19
3

Talvez você possa tentar instalar o "smokeping" e fazer algumas verificações de serviço (tcp, http, http, ...). Pode fazer bons gráficos de perda de pacotes.

    
por 28.02.2014 / 08:17
0

Recomendação do produto:

Nota: Este é um serviço comercial e custa dinheiro $.

No meu local de trabalho, usamos um serviço de monitoramento de rede de terceiros chamado Wormly .

Nós o usamos principalmente para garantir que os websites estejam funcionando, mas também podemos fazer verificações em portas específicas, etc.

Você pode obter uma conta básica e configurar alguns sensores para testar conexões TCP se o ICMP for um problema.
Ele irá produzir gráficos para você, que você pode mostrar ao seu provedor.

Os testes são feitos em várias torres de todo o mundo, e você pode pedir à equipe de suporte que defina uma torre em particular como a principal (usamos sydney, para que os gráficos mostrem um ping mais realista para nossa região)

Você pode até especificar um determinado texto ou um padrão regex que deve estar presente na resposta TCP, o que é muito legal.

    
por 05.03.2014 / 05:06