Interfaces vinculadas ao Linux penduradas periodicamente

2

Eu tenho vários hosts que estão mostrando problemas com conectividade. Ao trabalhar a partir da linha de comando, por exemplo, a digitação é congelada por um segundo ou mais, e depois é recuperada - então, é feita novamente.

O host de exemplo mais notório congela (entrada) por 15-30 segundos, depois recupera e sai 5 segundos depois. Os cabos de comutação não fizeram nada - mas a remoção de um dos cabos físicos fez com que tudo se resolvesse instantaneamente (e por que eu acho que isso é um problema de rede).

Olhando para a rede, não vi nenhum pacote flutuante que explicasse isso.

Essas interfaces ethernet (Gigabit Dell) estavam funcionando normalmente anteriormente, mas desde que mudamos os sistemas - e colocamos em um novo conjunto de switches - isso tem sido um problema em múltiplos hosts teoricamente configurados de forma idêntica.

Os switches originais eram um HP Procurve 1810-24G e um HP Procurve 1800-24G conectado com LLDP; os novos switches são ambos Cisco SG 200-26, que eu entendo como switches Linksys renomeados.

Isso é causado por um problema com os switches? São as configurações do switch? Os switches Cisco são incapazes de lidar com isso?

Não vejo onde a configuração está localizada; Eu procurei no usual /etc/sysconfig/network/devices , mas não há nada lá sobre as opções (como o mii polling) e nada sobre o método de equilibrar os dois. Procurando scripts, também não consigo encontrar nada em /etc/init.d/network .

Os hosts são quase todos os sistemas Red Hat Enterprise Linux 5.x (5.6, 5.7), mas alguns são Ubuntu Server 10.04.3 Lucid Lynx. Preciso de ajuda com os dois, se se trata disso.

UPDATE: Também estamos vendo alguns problemas com servidores nos switches originais.

Os switches HP e os switches Cisco também são interconectados (temporariamente); existe um cabo que vai de um switch para o próximo. Pings em qualquer um desses hosts mostram um pacote ICMP de cada 5-6 sendo descartado (expirou). Poderia haver uma interação entre os dois switches?

Ah, e os hosts estão usando a ligação com o Balance-RR como método.

ATUALIZAÇÃO: Um dos switches da Cisco está usando o Cisco Discovery Protocol (CDP) e o host VMware 4 ESXi está captando isso, mesmo que esse servidor ESXi esteja conectado a um switch HP.

ATUALIZAÇÃO: eu atualizei os switches da Cisco e desliguei o CDP, LLDP-MED e STP - os switches da HP não suportam CDP ou STP e eles não parecem suportar o LLDP-MED . Então está tudo desligado. Isso esclareceu os problemas nos hosts em nossa antiga rede conectada aos HPs - mas os hosts do outro lado ainda estão mostrando uma taxa inaceitável de pacotes perdidos - mas apenas alguns hosts.

Os hosts sem interfaces ligadas não estão mostrando problemas. Um ou dois desses hosts não possuem nenhuma interface ligada; um tem uma interface ligada, mas uma porta está desconectada.

O que aconteceria se eu pegasse uma interface escrava manualmente? Como a interface vinculada lida com isso?

ATUALIZAÇÃO: Através de testes, parece que derrubar uma interface funcional de ethernet de escravo não mata a coisa toda (que é como deveria ser). Fazer isso em hosts selecionados (mas não todos) resolveu o problema; por algum motivo, conectar-se a determinados hosts descartou um grande número de pacotes e outros sistemas não tiveram esse problema. Três hosts tiveram suas interfaces unidas reduzidas a uma única porta ethernet, e agora os pacotes descartados não parecem mais ser um problema em qualquer lugar.

É claro que isso não resolve o problema - ele simplesmente faz com que ele desapareça (o que é a primeira coisa no momento). A próxima coisa é verificar o cabeamento físico da próxima vez que eu for para o data center - as portas duplas devem estar em switches separados, mas são eles? Estará checando.

    
por Mei 20.03.2012 / 19:13

2 respostas

1

Aqui está um link para o material de ligação do Ubuntu: link

Quanto a eles, em geral, depende de qual modo de ligação você está usando. Se estiver usando o Modo 4, as configurações de switch precisam ser feitas para o cisco. Geralmente, é necessário configurar o LACP. Não tenho certeza sobre esses modelos que você tem.

Os outros modos de ligação não exigem configurações especiais de switch e geralmente dependem de se você deseja redundância como balanceamento de carga principal ou de entrada ou de saída para o modo que você escolher.

    
por 20.03.2012 / 19:27
1

Aqui está o link para o RHEL6

link

RHEL5

link

Como John disse, o uso do modo 4 requer que os protocolos 802.3ad ou LACP sejam ativados em seus switches. Você pode usar o modo 2 (backup ativo) para teste ou o modo 6 (Adaptive Load Balancing) no futuro.

    
por 20.03.2012 / 19:35