máquinas específicas na sub-rede perdem aleatoriamente a conectividade, mas o resto da rede está bem

1

Toda máquina física está conectada a um switch cisco e está na mesma rede 192.168.1.0/24

Cada servidor que eu tenho está executando o Centos 6.5. Um casal executa o KVM com várias máquinas virtuais. A maioria das máquinas ligaram o nic.

Máquinas:

servidor virtual (vs0) tem um monte de vm's (vm00, vm01)

servidor virtual (vs1) tem um monte de vm's (vm10, vm11)

então eu tenho algumas outras máquinas físicas aleatórias (web0, web1)

Normalmente, tudo funciona bem, mas ocasionalmente algumas máquinas perdem a conectividade.

web0 não pode efetuar ping no vm11

web0 pode fazer ping na web1, vs0, vm00, vm01, vs1, vm10

vm11 não pode efetuar ping no web0

vm11 pode fazer ping na web1, vs0, vm00, vm01, vs1, vm10

Todas as outras máquinas podem fazer ping em todas as outras máquinas

E depois de 30 minutos, tudo está bem novamente.

Ocasionalmente, o web0 não pode ver o web1, então não acho que seja uma coisa do KVM. E quando web0 não pode ver vm11, web0 pode ver vs1, então eu não acho que é um problema nic.

Eu tentei o tcpdump nas máquinas e nenhum pacote está atingindo as máquinas, exceto os pacotes ARP. Eu não sei mais o que procurar. Estou sem ideias para depurar isso. Alguma idéia?

    
por dan 02.05.2014 / 21:00

1 resposta

1

Eu me pergunto se o problema está relacionado à forma como a ligação está sendo feita, e o switch se confundindo com os endereços MAC nas portas, etc.

Eu estou supondo que você está usando o "Modo 0" para colagem. Tente alterar as coisas para o Modo 1 (backup ativo) ou (temporariamente) soltando uma das interfaces de ligação subjacentes em cada dispositivo e veja se isso torna as coisas mais estáveis.

    
por 02.05.2014 / 21:56