Servidor Windows perdendo conectividade

2

Um Windows Server 2008 R2 (SBS 2011 realmente) com o Service Pack 1 começou a expor um problema de conectividade de rede que, de repente, parece bastante difícil de depurar:

Ocasionalmente (sempre durante o horário comercial, aproximadamente 1-2 vezes por dia), a conectividade de rede é perdida. O host em si continua em execução, eu posso usar o console de forma interativa. O link Ethernet, conforme indicado pelos LEDs no gerenciamento do comutador e o NIC, continua ativo. A configuração IP ainda está conectada à interface e parece válida ( ipconfig produz uma saída sã). No entanto, nem mesmo as pesquisas de ARP podem ser concluídas com êxito.

Uma lista de coisas que não ajudaram:

  • redefinindo a porta do comutador ou o comutador
  • desativando / reativando a interface do servidor (no ncpa.cpl ou no gerenciador de dispositivos)
  • desconectando / reconectando o cabo de rede

Desligar e reiniciar o servidor sempre ajuda - é utilizável como sempre após a inicialização.

Coisas marcadas:

  • os registros de eventos não listam eventos suspeitos
  • os contadores de portas de rede do comutador não mostram erros
  • a conexão de rede não mostra sinais de estranheza (perdas, latências, desempenho ruim) enquanto os dados estão fluindo
  • o cabo e o NIC foram substituídos para descartar uma falha de hardware óbvia
  • o gerenciamento de energia da NIC foi desativado nas propriedades do dispositivo (gerenciador de dispositivos)
  • a NIC utilizada é uma Intel PRO / 1000 CT com o processador de rede Intel 82574L (o mesmo tipo é usado nas portas NIC integradas)
  • o conjunto antiviral do AVG ( Anti-Virus Business Edition ) está instalado no servidor, mas o componente do Firewall foi removido ao instalá-lo, portanto, não deve interferir aqui

Como uma falha de hardware parece improvável, estou tentando determinar qual componente de software poderia ser responsável por bagunçar a pilha de rede. Existe alguma maneira sensata de descobrir quais drivers estão na pilha de rede e, portanto, possivelmente interferindo? Alguém já viu algo parecido antes? Quaisquer ideias que possam levar à resolução são bem-vindas.

    
por the-wabbit 16.04.2013 / 14:27

2 respostas

0

Se foi tão de repente quanto veio. O switch foi substituído nesse meio tempo, mas o sistema mostrou estar funcionando por alguns dias sem problemas antes.

Edit: embora eu não tenha uma prova decente para isso, parece que o software responsável tem sido o Proxy WinGate instalado no mesmo servidor. Os relatórios dos usuários indicam que os problemas foram observados depois que o produto foi atualizado e desapareceu depois de desinstalado. Um cenário semelhante envolvendo drivers de filtro TDI foi documentado aqui , embora a resolução cubra apenas o Windows Server 2008. E o WinGate parece estar empregando o TDI de fato.

    
por 28.05.2013 / 09:26
1

Eu faria duas coisas para tentar resolver o problema:

Primeiro, remova o AV. Completamente. Não desative apenas uma parte ou outra, desinstale-a. Segundo, supondo que ainda falhe de vez em quando, mude a NIC e os cabos.

    
por 16.04.2013 / 14:48