Congela em uma rede da empresa

1

Temos uma rede de empresas de 100 Mbits com aprox. 50 estações de trabalho (principalmente XP-W8, principalmente DHCP), vários servidores (diversos), alguns outros dispositivos (adaptadores VOIP etc.) e dois switches Zyxel ES-1552. Existe um domínio (AD / Windows Server 2012) em execução.
Há congelamentos realmente irritantes na comunicação de rede, que duram de vários segundos a mais de um minuto, em relação a muitas estações de trabalho (mas não a todas) (não importa o DHCP / IP estático). Estes congelamentos ocorrem geralmente de manhã, quando o tráfego da rede é mais strong.

Por exemplo, existem três estações de trabalho XP (A, B, C) no mesmo local. Quando o congelamento ocorre, A e B param completamente a rede (sem internet / intranet, o Windows Explorer não responde devido a unidades de rede mapeadas, A não pode fazer ping B ou qualquer outra coisa (tempo limite)) e pode durar mais de um minuto. Ao mesmo tempo, a estação de trabalho C não enfrenta problemas. Depois, a comunicação é restaurada e todas as três estações de trabalho se comunicam sem nenhum problema.

Sou um programador, não um administrador de rede profissional. Tentei redefinir switches, ver logs, até instalei o Microsoft Network Monitor, mas não ajudei. Houve várias mudanças importantes em nossa infraestrutura de rede nos últimos três meses (um novo servidor, novas estações de trabalho, domínio), mas não consigo conectar os problemas com um evento específico.

Quais são os passos sugeridos para diagnosticar este problema (sem desligar a rede)? Muito obrigado.

    
por user681768917 27.03.2013 / 09:09

3 respostas

1

Mudar os interruptores para melhores (como muitos sugeridos) pode ajudar. Mas o problema desapareceu sem alterar o hardware. Três mudanças diferentes foram feitas. Um deles ou uma combinação deles ajudou.

  1. O Backup do Windows Server padrão ainda em execução no momento em que as pessoas já estavam no trabalho foi substituído pelo 7-Zip no modo de vários segmentos, que é significativamente mais rápido e é concluído antes que as pessoas cheguem ao trabalho. Essa foi a causa mais provável para os congelamentos, pois o servidor estava enviando a média. 300Mbit / s através de um link gigabit do switche para um NAS. Combinado com pessoas lendo / salvando arquivos grandes, isso pode ser um problema.

  2. Cabo de rede danificado / STP / (não usado, mas conectado a um dos switches) foi eliminado. (Isso poderia causar uma espécie de curto-circuito.)

  3. O Virtual Switch do Hyper-V no servidor foi desativado. Mesmo que os dados não passassem por isso (espero que sim - a outra das duas Broadcoms físicas foi usada), a taxa de transferência de dados melhorou. O backup do 7-Zip é até 15% mais rápido desde.

  4. O Wireshark descobriu que uma estação de trabalho com um adaptador de rede Attansic integrado (de alguma forma danificado) era responsável por 95% de todo o tráfego de rede (!!!). Depois de substituí-lo por outro adaptador de rede, não há tempestades de transmissão descobertas ainda.

por 19.04.2013 / 08:29
1
  • Verifique seu visualizador de eventos.

Pode haver pistas sobre o que está acontecendo. Isso pode estar no seu controlador de domínio ou estação de trabalho.

  • Teste o ambiente em uma janela de manutenção.

A última coisa que você quer fazer é fazer alterações não intencionais e toda a sua rede cai. Além disso, verifique se essas coisas acontecem quando há poucas unidades em execução, isso pode ser uma pista para uma investigação mais aprofundada.

Isole o problema na rede, use uma ferramenta de monitoramento de tráfego para ajudar a descobrir onde isso está acontecendo.

  • bufferbloat possível?

Normalmente o bufferbloat está no roteador existente devido a um pequeno gargalo, no entanto switches ou roteadores mal configurados podem exibir sinais de isso.

Pode ser possível que sua rede esteja sendo envenenada por arp por um dispositivo mal configurado ou (não provável), pessoa. Um dispositivo pode envenenar sua rede até que as atualizações corretas sejam enviadas novamente.

    
por 27.03.2013 / 15:29
0

Esse som suspeitosamente parece Spanning Tree convergindo para mim. Não tenho certeza do que todos esses switches são capazes de fazer, mas a implementação pré-Rapid Spanning-Tree baseada em padrões levaria em torno de 45 segundos para mover uma porta de novo para encaminhamento. Pode ser que seus switches estejam sobrecarregados e precisem fazer algo com o STP em um subconjunto de portas? Não é real familiarizado com os produtos ZyXEL ...

Você tem algum log da GUI de gerenciamento? É a configuração do switch para fazer Spanning-Tree, e existe uma opção para o Rapid STP ou MST?

Como alguém mencionou, você já pensou em atualizar esses dispositivos para algo mais empresarial? Algo como um Cisco 2960 de 48 portas seria uma boa opção para um escritório de pequenas empresas, e eles são bastante razoáveis no eBay. A configuração varia de simples simples a complexa, com base nos recursos que você deseja.

    
por 28.03.2013 / 02:59

Tags