Monitorando a latência da Internet

3

Eu tenho usado o smokeping para monitorar a latência da internet (para detecção precoce de problemas) em 8.8.8.8 por vários meses. Na sexta-feira a latência média passou de 12ms para 55ms e esteve no planalto de 55ms durante 3 dias. Nossa WAN usa o mesmo provedor para todas as conexões de internet, então estamos curiosos para saber se eles têm algum problema ou se o 8.8.8.8 apenas decidiu sufocar o cano.

Nosso ISP alega que o problema está em 8.8.8.8, mas ainda sou suspeito.

Noto que obtenho a mesma latência (55ms) para 4.2.2.2, mas não estava fazendo o gráfico desse IP, portanto, não tenho dados de referência para provar uma degradação no serviço.

Qualquer recomendação sobre como buscar essa anomalia seria útil.

PS: O Flow não mostra nenhum tráfego excessivo em nossos roteadores que apontam para uma queda no serviço causada por comportamento.

    
por josh 22.08.2011 / 22:14

3 respostas

5

Quando você vê a mudança de latência assim, a causa em 99% do tempo são alterações no roteamento da Internet. Infelizmente, a menos que você esteja capturando traceroutes periódicos, não há nada que você possa fazer para ver qual era a rota.

Eu duvido que o 8.8.8.8 esteja fazendo algo diretamente que causou o salto na latência.

    
por 22.08.2011 / 22:20
4

8.8.8.8 é o serviço de DNS público do Google.

Eles alcançam a proximidade geográfica por meio do BGP anycast, o que significa que o servidor físico que você acessa em um dia e o caminho que você leva para chegar a ele podem mudar drasticamente dependendo de onde o anúncio é feito pelo Google e onde o caminho mais curto é para esse local.

Parece que seu tráfego mudou de um servidor próximo para um mais próximo - o Google pode ter derrubado o próximo, ou o processo BGP do seu provedor pode ver outro anúncio de 8.8.8.0/24 mais próximo em termos de roteamento de saltos para chegar ao destino.

Isso não é nem aqui nem ali; O ponto é que 8.8.8.8 não é um bom endereço para usar para medir o desempenho do seu link de internet, e flutuações como essa devem ser esperadas se você fizer isso.

    
por 22.08.2011 / 22:50
2

traceroute mostrará quanto tempo cada salto leva, e você pode descobrir onde fica o maior contribuinte para o seu tempo de rmstrip de 55 ms. Como ErikA diz, sem dados anteriores, não ajudará muito, mas pelo menos você terá alguma ideia.

    
por 22.08.2011 / 22:38