Resolução de problemas de uma rede “lenta”

20

Todos nós já tivemos uma reclamação de que a "rede" está "lenta" em algum momento: pode estar localizada em um quarto (switch) ou em um computador, pode ser apenas Internet (DNS? Problema do navegador?) apenas uma aplicação (consultas SQL de longa duração? Varredura AV em execução?).

Quando você descarta problemas óbvios de sistema e / ou aplicativo, como você testa uma rede para lentidão ou comportamento errático? Você trabalha o seu caminho até as camadas OSI? Em caso afirmativo, como proceder para verificar cada camada? O que você faz para garantir que a rede física esteja bem em um ambiente desconhecido? E quanto a muitas transmissões ou uma tempestade de transmissão? Camada 3 e acima? traceroute? Alguma outra dica, métodos, ideias? Recursos e ferramentas obrigatórios (espelhamento de portas, SNMP, monitoramento, etc.) para todos os tamanhos de redes?

    
por WuckaChucka 23.06.2010 / 15:04

8 respostas

9

tcpdump e wireshark são seus amigos.

Eu acho que assistir pacotes no fio de uma rede 'lenta' contra uma 'boa' rede geralmente é o que identifica um problema.

Existem muitos tipos de 'lentos'.

Você pode rastrear a latência em sites locais e da Internet usando uma ferramenta como o SmokePing. (O SmokePing pode ser configurado para rastrear a latência do ICMP, bem como a latência do serviço dos serviços TCP)

Seus comutadores devem rastrear pacotes de transmissão versus pacotes unicast. Gráfico dessa relação.

Eu também gosto de monitorar traceroutes (verificar nomes de domínio do ISP entre sites 'importantes').

Espero que esses comentários ajudem.

    
por 23.06.2010 / 16:27
6

É difícil dar respostas específicas, já que 90% desse trabalho é experiência que ensina onde procurar o tipo de problema, e os outros 90% sabem onde procurar no Google para obter dicas de por onde começar.

Eu geralmente tento o material da sacola de papel como fazer com que o cliente demonstre o problema (principalmente para descartar problemas com os dedos e quaisquer problemas que o cliente possa ter descrevendo seu problema) e tentar duplicar o problema em outro computador. Isso faz com que você saiba onde procurar.

Não esqueça o problema corretivo de uma reinicialização, especialmente para sistemas Windows, até hoje. Costumava ser assim tanto que eu perguntava às pessoas "Você reiniciou? Bem, tente isso e deixe-me saber se o problema persistir" - isso corrigiu uma grande porcentagem dos problemas que me foram perguntados.

Frequentemente, há problemas pendentes em problemas de resolução de DNS e conectividade básica (ACLs em roteadores, lacunas de ar na rede, pings / traceroutes / mtrs em sites remotos, etc.).

Para serviços sobre os quais você tem controle direto, a execução de nagios ou algo para garantir que o serviço esteja realmente em execução pode, com frequência, levá-lo a corrigir problemas antes que os clientes os informem sobre eles. Você provavelmente também quer estar executando a coleta de estatísticas, seja diretamente através do munin ou algo assim, ou via SNMP para algo como o Cacti.

Eu costumo tentar ter o Cacti rodando contra pelo menos todos os meus principais switches e firewalls; sempre que possível, corro o Cacti contra tudo o que posso. Nesses casos, geralmente estou procurando itens como contagens de erros de porta ou tráfego excessivo. Os gráficos de firewall de alguns dispositivos podem mostrar o uso da CPU e as sessões simultâneas; você aprenderá em quais limites seu dispositivo de firewall começa a ter problemas.

Seu firewall pode logar em um dispositivo syslog; se assim for, registre tudo que puder e procure por sugestões. Isso será mais fácil se você executar algo como syslog-ng ou rsyslog ou splunk que permita dividir seus logs um pouco, em vez de lidar com um arquivo monolítico.

Eu também tento rodar o nfsen pelo menos dentro do meu firewall, e o uplink para o provedor de internet onde for possível. Isso permite que você volte no tempo para ver as sessões e ver quem estava fazendo o quê; isso às vezes pode pegar comportamentos interessantes.

    
por 23.06.2010 / 17:42
5

Aqui estão algumas ferramentas úteis para solucionar problemas de latência e outros problemas de rede:

  • o modo OSI l - comece da parte inferior e trabalhe até
  • ping - verifique seu RTT (isto é, latência)
  • HTTP ping - útil se o firewall bloquear os ICMPs normais
  • ping -r 9 - útil para identificar situações de roteamento assimétricas
  • traceroute - como meus pacotes estão chegando e como os roteadores estão respondendo? Esteja ciente de que os roteadores geralmente processam esses pacotes com baixa prioridade, então o desempenho real pode ser melhor.
  • Wireshark - requer um pouco de conhecimento, mas você não consegue obter um nível muito inferior
  • Analisador de TCP / IP SpeedGuide.net - verifique as configurações de TCP do seu PC
  • SG TCP Optimizer - (apenas para Windows) sugere maneiras de otimizar suas configurações de NIC
  • IP Chicken - qual é o endereço IP de origem (não NAT)?
  • link - talvez seja você ...
  • Teste de velocidade de banda - verifique suas velocidades de download / upload
  • Ferramentas de rede - executam ferramentas / testes fora da sua rede
  • verifique suas portas de rede em busca de erros / CRCs / etc. -
  • verifique se sua rede está superutilizada (monitores de largura de banda) & tempestades de transmissão
  • verifique a inundação de unicast - use wireshark e monitore o tráfego de unicast que não é destinado à sua estação de trabalho.
  • verifique se a raiz raiz da árvore de abrangência está posicionada corretamente
por 08.07.2010 / 14:42
4

Se você estiver executando uma rede sem fio, um dos frequentes lentidão será a interferência do canal. Um monte de SSIDs em uma área pode realmente retardar o tráfego de rede. (Pense: a demonstração do iPhone 4 no WWDC '10).

A resolução deste problema é bastante fácil se, com software, puder mostrar os padrões de tráfego sem fios na área. Há uma boa versão gratuita e baseada na Web em: link . (divulgação: Eu trabalho para Meraki)

Para reduzir a interferência, é melhor estar nos canais 1, 6 ou 11. O uso de equipamentos 802.11n com freqüência de 5GHz também pode ajudar.

    
por 24.06.2010 / 01:32
1

Eu sempre começo a monitorar o material da camada 2 usando Cactos . Isso fornecerá uma boa quantidade de dados que você pode usar para procurar padrões e comparar seus gráficos do Cacti quando tudo estiver funcionando bem quando os usuários virem lentidão.

Provavelmente não encontrará o problema exato, mas lhe dará um bom ponto de partida para ajudar a diminuir o problema.

    
por 23.06.2010 / 16:16
1

Eu inicio no roteador mais externo e trabalho para baixo, e medi o desempenho da maneira mais primitiva: use um site de teste de largura de banda ou um site de FTP externo conhecido que forneça velocidade de upload / download e continue até encontrar o nível em que o problema reside.

Quando souber onde está o problema, implemente suas ferramentas e monitores sofisticados. Mas não perca tempo fazendo essas coisas em todas as camadas. Vai demorar uma eternidade.

    
por 23.06.2010 / 16:27
1

Você também precisa conhecer seus servidores e ambiente de trabalho / cliente, em vez de simplesmente assumir que o usuário está correto quando diz "a rede está lenta". Você precisa solucionar metodicamente cada problema - como outros disseram, primeiro você deve poder visualizar e, idealmente, reproduzir o erro e, em seguida, trabalhar a partir daí de uma maneira que faça sentido para o cenário.

Ter um bom gerenciamento e monitoramento na rede e nos servidores pode economizar muito tempo, no entanto, porque você não está tentando criar instrumentação durante a execução, possivelmente também tentando atenuar ou corrigir os sintomas e lidar com usuários / clientes queixosos.

As respostas para tcpdump e wireshark não estão erradas, essas podem ser peças vitais do seu kit de ferramentas. Mas a menos que você esteja certo de que na verdade é a rede, eles não devem ser a primeira coisa que você procura.

    
por 23.06.2010 / 17:54
0

Rede lenta é um fenômeno comum. Velocidade de rede lenta pode ser causada por várias coisas. solucionar problemas de rede lenta é um dos trabalhos mais comuns e problemáticos no gerenciamento diário de rede.

De acordo com a análise, as principais razões para a rede lenta são:

Loopback
Broadcast/Multicast storm
Virus attack
Server slow response
Too many clients
Application slow response
Error client mask

Como podemos descobrir rapidamente a causa da rede lenta acontecer? É uma boa ideia capturar e analisar pacotes com um analisador de rede (Ax3soft Unicorn, wireshark e assim por diante).

Você também leu o artigo "Encontre Razões para a Rede Lenta", clicando na URL ( link ) para visitá-lo.

    
por 14.03.2015 / 02:56