o tráfego pesado da rede afetará outras conexões no HP ProCurve V1810-48G?

4

Eu tenho um switch HP ProCurve V1810-48G com alguns servidores executando o Citrix XenServer conectado a ele (tudo em um rack). O switch está quase em sua configuração padrão (sem VLAN, sem espelhamento / monitoramento de porta, nenhum outro roteador conectado além do gateway para a Internet).

Durante a cópia de algumas centenas de GBytes de dados de server27 para um diretório montado em NFS em server18 , notei mensagens de erro relacionadas à rede para outros servidores no mesmo rack, como se eles não pudessem mais enviar / receber tráfego entre si ou seus usuários, como mensagens de erro de serviços de monitoramento da Web externos que um determinado site não está mais acessível.

Após cancelar o comando copy, tudo estava normal novamente.

Note que todos os servidores mencionados estão conectados ao mesmo switch e estão localizados na mesma rede IP. Eu sempre achei que uma conexão entre dois servidores em um switch não afetaria nenhum outro servidor conectado ao switch.

Eu conectei o switch a um servidor de monitoramento do zabbix. Aqui está a imagem: Você pode ver aqui que o tráfego de saída do servidor27 (canto inferior direito) para o servidor18 (segunda linha à esquerda) parece afetar todos os servidores do rack. Eu também suspendi o processo de cópia uma vez, e você pode ver a queda no tráfego de rede para todos os outros.

Você também pode ver lacunas nos diagramas nos quais o servidor zabbix (server21) não conseguiu se conectar ao switch.

A verificação do tráfego de rede no lado do servidor (em vez do lado do comutador) mostrou que há apenas o tráfego normal, não o volume enorme mostrado nos diagramas acima.

Alguns comentadores apontaram que o tráfego entre duas portas em um switch não deve afetar nenhuma outra porta. Este diagrama sugere, no entanto, que existe um problema sutil em algum lugar. O tráfego de apenas 20 MByte / s afeta a conectividade a todos os outros sistemas.

    
por nn4l 02.09.2012 / 22:54

3 respostas

1

Não é muito longe de "você já tentou ligar e desligar", mas você atualizou o firmware? Se você observar as notas de lançamento, existem algumas correções relacionadas ao ARP.

link

No que diz respeito à coleta de mais informações para que as pessoas possam ajudar na solução de problemas, você tem registros do próprio switch quando isso está acontecendo?

Você pode compartilhar quais alterações de configuração, além das informações de gerenciamento, foram feitas a partir do estado padrão?

Algum dos hosts em questão está executando o servidor Xen? Você vê o problema entre quaisquer outros hosts (agora que você tem gráficos históricos, você deve ser capaz de verificar se isso acontece em outro lugar)?

    
por 04.03.2013 / 18:02
0

Precisamos esclarecer a situação para ajudar a dar a melhor resposta.

Você pode confirmar que isso é tudo o mesmo rack ou que o switch definitivamente tem configuração padrão, como configuração de porta, vlan, gateway.

i.e. DC1
cremalheira 1:
Comutador HP
server_A
Server_B

DC2
cremalheira 2:
Comutador HP
server_C
Server_D

Caso contrário, parece que a explicação que você deu é que server_C e Server_D estão em um data center diferente, mas ainda estão no mesmo segmento de rede para se comunicar. Se esse for o caso, você está usando os recursos locais máximos para transferir os dados e isso causaria seus problemas, se os servidores_C e _D usarem o switch DC2 rack2 HP como backbone.

Perguntas para você: Você trabalha no centro de dados ou administrador de sistemas para os servidores? Você pode fornecer o segmento de rede? server_A e B na rede x.x.x.x etc Como o _C e o _D estão conectados a _A e _B?

Por favor, seja mais específico na localização do server_C e Server_D. I.E. eles estão localizados em buidling x ou rack x

Obrigado.

    
por 03.09.2012 / 00:26
0

Em situações normais, não, o tráfego do servidor A para B não afetará C a D. Além disso, um fluxo unidirecional de A para B está utilizando apenas a largura de banda total em uma direção, a Gigabit Ethernet é bidirecional. está realmente usando apenas metade da largura de banda dessas portas.

O único problema possível do "fim" do Switch da transação seria um problema de configuração. Pode ser o espelhamento / monitoramento de porta (onde é enviado todo o tráfego de uma ou mais portas para uma única porta "monitor"). Ou pode haver alguma política de uso (eu não acho que as séries 1800 suportam políticas de largura de banda ou similares). Você também pode ter a configuração de vLANs, com um roteador de gargalo em algum lugar (apenas estar conectado ao mesmo switch não necessariamente os torna todos no mesmo domínio de broadcast, mesmo que eles sejam poderiam ter várias sub-redes em um domínio de broadcast, forçando o uso de um roteador novamente).

    
por 23.01.2013 / 16:34