Solução de problemas de perda de conectividade de rede no Windows 2003 - O que mais verificar?

3

Estamos enfrentando um problema estranho em nosso data center. Nosso servidor de backup (executando o EMC Networker) perde a conexão de rede a cada dia alternado em torno de 3:00 da manhã (o agendamento de backup começa à meia-noite). Após 2 horas de interrupção, a conectividade de rede é recuperada automaticamente e volta ao normal.

O que observamos:

É improvável que seja um problema de rede, já que está diretamente conectado ao switch de farm de servidores (conexão de camada 2 sem saltos intermediários). Além disso, o servidor está conectado a dois switches diferentes para balanceamento de carga usando o Broadcomm Teaming.

a) Se fosse um problema relacionado ao switch, é improvável que ambas as portas de rede caiam, já que elas estão conectadas a um switch diferente.

b) Uma possibilidade de problema de Vlan também está descartada, já que outros dispositivos na mesma Vlan estão bem.

c) O status da interface do switch está sempre ativo. Mas há muitos pacotes perdidos durante o período de interrupção - Pode ser atribuído à alta utilização da interface do servidor de backup (perto de 100%)

d) A conectividade é restaurada sem qualquer alteração na rede.

O próximo suspeito é a utilização de recursos no servidor Windows. Tanto a CPU quanto a memória raramente excederam 80%, mas a utilização da placa NIC é alarmantemente alta (perto de 100%)

Não tem certeza de como investigar isso?

    
por Benny 01.06.2010 / 13:56

5 respostas

1

Eu suspeito de problemas de drivers ou incompatibilidade de duplex. Tente atualizar os drivers e verifique se o duplex em cada extremidade é o mesmo. Verifique também as estatísticas de ethernet do switch (se você tiver erros, colisões, etc ...).

O que significa que perde a conectividade de rede ? Não é alcançável, mas a interface está ativa? É alcançável, mas tem muita perda de pacotes?

    
por 01.06.2010 / 15:04
1

Você tentou alterar a placa de rede?

    
por 18.07.2010 / 01:19
1

Como você está percebendo que perde a conectividade de rede? O que você quer dizer com isso? Você tem algo monitorando isso que diz que não pode ser alcançado? Existe alguma coisa nos logs de eventos, se sim, o que?

Se o uso da rede for alto, ou seja, até o ponto em que está totalmente saturado, você poderá ver o que parece ser a conexão descartada. No entanto, é difícil dizer com base na sua descrição. Meu palpite é que seu trabalho de backup está maximizando seu cachimbo. Você tem um trabalho de backup que é executado a cada dois dias:)

    
por 07.01.2012 / 23:46
0

Este é um resultado longo, mas talvez outro dispositivo em sua rede tenha o mesmo endereço IP? Isso definitivamente causaria problemas de tráfego.

    
por 18.07.2010 / 03:47
0

Que tipo de mudança é essa?

Existem outros dispositivos no mesmo switch passando por algum problema de comunicação quando esse problema específico está ocorrendo? Embora seja raro e improvável, você pode estar esgotando recursos finitos nessa mudança e, em certo sentido, se matizando.

Além disso, se você tiver mecanismos para impedir o DOS, eles podem basicamente ocultar seu servidor problemático até que os padrões de uso voltem ao normal.

    
por 16.03.2012 / 22:01