Desempenho ruim da rede entre o AIX 7.1 em 1 Gbit / seo SLES 11 em 10 Gbit / s [fechado]

1

Estou tendo problemas com o desempenho da rede entre o SLES e o AIX. Eu testei o desempenho da rede de

  • AIX 1 Gbit / s para AIX 1 Gbit / s
  • SLES 11 10 Gbit / s para SLES 11 10 Gbit / s
  • AIX 1 Gbit / s para SLES 11 10 Gbit / se reversa

também existem outras máquinas na rede, por isso não temos a largura de banda total, mas a rede definitivamente não é inundada pelas outras máquinas.

via:

  • netcat
  • scp
  • niping (ferramenta de medição de desempenho de rede do SAP)

entre duas máquinas AIX estou obtendo resultados "decentes" de aproximadamente 110 Mbit / s entre as duas máquinas Linux estou obtendo bons resultados de cerca de 2,2 Gbit / s mas entre o Linux e o AIX, independente de qual direção, estou obtendo apenas cerca de 30 Mbit / s, consistentemente ao longo de todas as 3 ferramentas de medição. Todos os adaptadores testados estão na mesma sub-rede!

O roteamento não é o problema. Quando estou fazendo traceroute, os nós estão se conectando diretamente uns aos outros sem dar um salto sobre um gateway. Também não há Ierrs / Oerrs de acordo com o netstat -i em qualquer máquina. O teste de estabilidade da rede de mais de 20 minutos via ping também é decente.

Então, pessoalmente, eu diria que posso excluir a possibilidade de um problema de rede e restringi-lo à negociação de velocidade ou à negociação do tamanho do buffer entre o AIX e o Linux. Para sua informação: Todos os hosts são partições lógicas (máquinas virtuais, por assim dizer) no IBM PowerVM. Alguém tem uma ideia do que fazer?

    
por dafrk 28.06.2016 / 14:52

2 respostas

1

tente;

  1. troque todos os cabos na rota por novos
  2. isolar linux e aix como apenas duas máquinas em um único switch (reduzir o ambiente de teste)
  3. cross over patch com configurações estáticas (se possível, reduzindo novamente)
  4. caso seja o switch com falha, teste com o segundo switch
  5. entre no próprio switch e verifique se há flapping ou erros nas portas
  6. execute wireshark no linux e capture o tráfego e identifique de que lado o atraso está. ou se alguma coisa está acontecendo. (se você não pode instalar o wireshark localmente, tente uma porta promíscua e use uma terceira caixa para monitorar)
  7. experimente com o netcat no UDP, pois o udp não possui handshake, talvez o TCP com seus requisitos e as diferenças de quadros façam parte do problema. info
  8. mova as portas também corrigidas. verifique se o switch não possui nenhuma agregação de link indesejada ativada que possa reproduzir aves

110mbit / s aix para aix é abaixo do esperado e sugere um possível problema. o aix melhora com qualquer outra coisa?

tente transferir para a localização do nfs usando o mount. e tente transferências de ftp simples (use um arquivo grande, apenas tempo e faça as contas para obter a sensação de bola).

observe que o SCP tem sobrecarga de criptografia e vai exigir muito processamento. então dirija-se a transferências não criptografadas para benchmarking / timing.

espero que isso isole.

    
por 28.06.2016 / 15:58
1

O problema está na versão padrão do kernel do SuSE 11 SP4 ser muito antigo. Versão do kernel do DVD é 3.101.0.63. Esta versão do kernel não suporta o envio grande SEA proprietário da IBM e o ajuste dos tamanhos de buffer de recepção e envio via ethtool. Nós atualizamos para o kernel 3.101.0.100. Então eu ativei largesend e tamanho ajustado e recebi tamanho de buffer via ethtool. Agora tudo funciona como um encanto. Agradeço a vocês por me darem a ideia de ativar o envio grande porque senão eu não encontraria isso.

    
por 29.06.2016 / 10:58