NIC parou de receber 20% dos pacotes

2

Eu conecto à minha LAN gigabit com a minha NIC baseada em RTL8111C. Está em uma Gigabyte GA-P43-DS3. Nas últimas 3 semanas notei que a minha taxa de transferência caiu dos habituais 40-60 MB / s (usando um NAS em SMB) para cerca de 2-10 MB / s. Eu pensei que talvez o servidor fizesse alguma limitação de largura de banda, mas de qualquer outra taxa de transferência de PC estava OK.

Troquei o cabo do PC e tentei diferentes portas do switch. Quando verifiquei o tráfego com o Wireshark, notei que havia erros de TCP, como ACKs duplicados. Mais tarde, verifiquei a taxa de transferência com o iperf e foi tão baixo quanto quando eu copiei arquivos em SMB, então o problema deve estar na rede.

Quando fiz um teste sobre UDP, mostrei que cerca de 10-20% dos pacotes foram descartados. O engraçado é que, se eu usar uma porta com número menor no meu switch, a taxa de erro é muito maior. (Por exemplo, porta nº 1: 21% vs. porta nº 8: 11%)

Eu acho que a taxa de transferência caiu porque os pacotes foram perdidos durante a transferência, então o TCP diminuiu o processo. Também notei que essas taxas de erro se aplicam apenas ao recebimento de pacotes. O computador pode enviar pacotes com perdas de quase 0%.

Eu verifiquei a rede com cabos e computadores diferentes e todas as combinações estavam funcionando bem. A taxa de queda foi de cerca de 1 vs. 460.000 pacotes (quase 0%).

É comum que os NICs parem de receber pacotes? Por que importa qual porta eu uso no meu switch?

Atualização : eu uso um switch Linksys SD2008. Eu tentei todas as suas portas com PCs e cabos em bom estado. Não importa qual combinação eu usei, não houve problema, apenas com o PC afetado. Tenho certeza de que sua NIC está falhando. Eu só me pergunto por que importa qual porta eu uso. A diferença entre as portas pode ser medida, mas apenas com o PC afetado.

Atualização 2 : Eu uso o Windows 7 x64, mas eu verifiquei com o Linux (Fedora 12 x64) e obtive resultados semelhantes, então é improvável que seja um problema de driver. As portas do SD2008 são divididas em 2 grupos de 4 portas. O problema está presente, não importa qual grupo eu use. No entanto, ainda não entendo como é possível que portas com números mais baixos tenham uma taxa de erro mais alta ...

    
por KovBal 17.01.2010 / 19:02

2 respostas

2

Os diagnósticos adicionais certamente apontam para um NIC com defeito, especificamente porque o problema é consistente quando você tenta o mesmo hardware com um sistema operacional diferente, mas outros sistemas não são afetados.

Para responder a sua primeira pergunta - falhas completas de NIC não são incomuns (ter redundância e até mesmo redundância de nics em servidores é praticamente obrigatório por outras razões), mas falhas parciais também são possíveis, especialmente no circuito físico e mecânico. partes. Em um padrão (1000BaseT usando conectores RJ45) problemas Gigabit Ethernet nic com qualquer um dos quatro pares de contatos de sinalização, o conversor analógico para digital, o filtro, o equalizador de avanço, o cancelador de eco ou o relógio (e possivelmente outras coisas) causar esses problemas sem necessariamente levar ao nic completamente falhando. O resultado geralmente seria um sinal muito mais fraco para o desempenho de ruído e isso levaria à perda de pacotes, já que o decodificador em cada extremidade obterá dados que claramente apresentam erros.

para responder à sua segunda pergunta problemas como esses que envolvem circuitos analógicos na camada física da rede podem levar à variação no padrão de erros que você está vendo através das portas. Quando tudo está funcionando de acordo com a especificação, é bem possível que cada porta ainda tenha habilidades de manipulação de sinal para ruído significativamente diferentes, é que todas as portas serão boas o suficiente para lidar com sinalização GigE sem erros [significativos] para que a variação seja invisível ( e irrelevante), mas quando você adiciona um dispositivo externo padrão, a variação pode se tornar aparente.

Se você quiser realmente testar as coisas, experimente o sistema com alguns cabos curtos e muito longos e veja se isso faz diferença, se o problema é que os níveis de Sinal-ruído do nic são muito baixos, então a taxa de erro deve piorar com cabos mais longos.

    
por 17.01.2010 / 23:22
0

Em uma rede doméstica, não importa qual porta você usa no switch (os switches corporativos têm algumas configurações mais complicadas, mas isso não soa como sua configuração).

Não é particularmente comum que as placas de rede comecem a falhar, mas isso acontece de tempos em tempos. Se você não alterou os drivers no seu PC, parece sugerir um problema de hardware de algum tipo, seja uma falha na placa de rede ou possivelmente até mesmo um problema no fornecimento de energia

    
por 17.01.2010 / 19:25