perda massiva de pacotes quando os servidores são colocados online

2

Esta é uma continuação do servidor ubuntu, ssh, gravação falhada: canal quebrado . Estou começando uma nova pergunta, porque não acredito que o problema esteja isolado no ssh / ubuntu.

Tenho dois novos servidores (Dell PowerEdge R715, R210) com o servidor Ubuntu 10.04 64bit instalado. Estou executando uma pilha de switches Cisco 3750 com dois firewalls / roteadores Juniper SRX240. A configuração é basicamente roteador em uma vara, temos 3 vlans: um interno, um dmz e uma rede de armazenamento (iSCSI) todos na mesma pilha. Nenhuma comutação da camada 3 está sendo feita na pilha da Cisco e a DMZ está completamente isolada da pilha em um switch diferente.

Existem cerca de 10 outros servidores Dell PoerEdge nesta mesma rede (e pilha) que estão em execução há anos sem problemas. A maioria deles está executando o SLES 10 ou o openSUSE, mas um deles está executando o servidor Ubuntu 10.04 64 bits. Eu desconectei todos os NICs desses novos servidores, exceto aqueles que vão para a nossa vlan interna.

Se eu inicializar uma ou ambas as máquinas e deixá-las repousar por cerca de dez minutos, começaremos a obter até 20% de perda de pacotes de outras máquinas na rede e até 40 a 50% de perda de pacotes dos servidores problemáticos.

Alguém tem uma ideia de por que isso pode estar acontecendo ou o que posso fazer para solucionar o problema? Eu não me importo de limpar essas caixas se for preciso, ainda não há dados de produção sobre elas.

    
por cmhobbs 30.11.2010 / 17:27

3 respostas

3

Eu começaria olhando os buffers de log do switch (ou o syslog para o qual você os está exportando, se você tiver um).

Eu já vi problemas no passado com máquinas Linux multi-NIC respondendo inapropriadamente a ARP (como em "não na interface esperada") e ainda mais problemas com blades em um chassi de servidor blade onde havia várias VLANs conectadas para o switch, mas não (trabalho) maneira de impor VLANs no switch blade real. Isso deve aparecer como reclamações relacionadas ao MAC nos registros.

Como uma segunda etapa, as coisas ficam melhores se você ativar o arp_filter em todas interfaces em seus novos servidores?

    
por 01.12.2010 / 12:20
0

Eu tive um problema semelhante e foi causado por várias VMs sendo configuradas com o mesmo endereço MAC. Apenas gerar um novo resolveu o problema.

    
por 25.08.2015 / 17:08
-2

Eu experimentei o mesmo problema, mas também com várias VMs. Acabou sendo as configurações do Firewall na minha máquina.

    
por 12.06.2016 / 13:44