Respostas diretas
First question: why does the top mtr suggest packet loss at 192.168.100.254, when the bottom one does not?
mtr envia pings (resposta de eco ICMP) com o incremento do IP TTL até obter uma resposta. 192.168.100.254 responde de forma diferente ao responder a condições de expiração TTL (baixo sucesso) vs resposta de eco ICMP (alto sucesso)
Second question: how can I determine better what might be causing this?
Quando você diz "causando isso", eu suponho que você esteja falando de suas sessões ssh, em vez dos resultados estranhos ... certo? Um par de pensamentos ...
Execute mtr
diretamente para cada host no caminho do 11-hop e veja se você pode encontrar algum sintoma interessante a partir de um dos saltos; com base no seu primeiro mtr
, isso pode não ser muito mais produtivo, mas vale a pena uma chance. Também fale com o administrador do 192.168.100.254 para ver se vocês podem descobrir por que as respostas do ICMP TTL estão sendo apagadas.
Outros pensamentos
-
Existem três causas gerais de problemas de rede: perda de pacotes, atraso de pacotes (enfileiramento) ou reordenamento de pacotes. No entanto, vamos lembrar também que, às vezes, problemas no nível do host contribuem para o seu problema 1 .
-
Vamos supor que, no momento em que o
192.168.100.x
vlan não esteja no lugar do seu problema e sua topologia seja assim:HOST_A----------------------HOST_B 192.168.100.x 216.26.162.162
Se você ainda não estiver ssh-ing de uma máquina Windows para HOST_A
, faça 2 . Agora grave sua área de trabalho do Windows 3 . Quando o problema acontece novamente, o vídeo gravado é uma ótima trilha de auditoria para onde seus problemas podem estar (ou seja, na rede, nos hosts ou em uma combinação de ambos). Se você puder de alguma forma ver ntp
tempo neste vídeo, melhor ainda ... isso lhe dará uma maneira de voltar atrás na análise por syslog
.
NOTAS FINAIS
- Um deles está trocando para disco, consumindo muita CPU (talvez causado por uma consulta de script / banco de dados) ou ocupado intermitentemente?
- Com pelo menos quatro janelas, uma para ssh entre
HOST_A
eHOST_B
, outra para uma sessão sniffing emHOST_A
, as duas últimas devem estar em execuçãotop
ouvmstat 5
onHOST_A
and% código%. - Use o que você quiser, mas eu uso Camstudio (a cópia beta é minha favorita no momento); é gratuito e de código aberto.