Atualmente estou no teste do ambiente de rede VMware NSX e encontrei alguns problemas.
Meu ambiente é:
- Management Cluster with 3 Hosts and NSX components on 2 dedicated Hosts
- Compute Cluster with 2 Hosts
- Single 1Gbps Switch
- vSphere version 6.0 and NSX version 6.2
- One dedicated UTP line per all Host for Management and iSCSI(VLAN tagged)
- One dedicated UTP line per all Host for Transit Network(for VM traffic)
- One dedicated UTP line per Management Host for External Network
Quando um VM V
on Host H
envia dados para VM W
on Host I
sobre a rede NSX, ocorre a reintrodução pesada. Eu testei muitos casos abaixo:
Casos com problema:
V
envia cerca de 20MB para W
em sessão única: retransmissão em torno de 19MB V
envia cerca de 50 MB a W
em sessão única: retransmissão apenas em 19 MB V
envia cerca de 2MB para W
em 30 sessões simultâneas: retransmissão em posição aleatória. Quando esta condição, eu encontrei algumas incompatibilidades de ordem de pacote (talvez causa de retransmissão) no dump de pacote de H
vmnic
(uplink), e pacotes atrasados são uniq (não ocorrem anteriormente no dump), mas em despejo de vDS
downlink para VM V
ou sfw
de V
, eles ocorrem duas vezes (pacotes originais e pacotes retransmitidos).
Então, eu acho que o problema são alguns pacotes perdidos na pilha lateral do remetente, especialmente entre VM V
e NIC Física do Host H
.
Para dividir o caminho / pilha de dados em dois setores e verificar de forma independente, testei os mesmos casos com outra VM de destino X
no mesmo Host H
. então eu obtive o despejo limpo e descobri que não há nenhum problema de retransmissão entre as VMs no mesmo Host. (então eu acho que não há ponto de erro no próprio vDS e acima.)
Em seguida, testei os casos abaixo para verificar se o problema está relacionado a tráfego intenso de dados ou filtragem e / ou encapsulamento pesado ou não:
Network I/O Control
ativado: mesmo problema Network I/O Control
: mesmo problema com alguns diffs. N I/O C Limit
: mesmo problema TSO
desativado vnic
de V
(driver e1000): mesmo problema vDS
MTU
9000: mesmo problema com mais perguntas Algumas coisas diferentes são:
Quando Network I/O Control
está habilitado, primeiro RTT
é aumentado imediatamente antes da restransmissão e depois da retransmissão concluída, os valores RTT
estão na faixa estável.
Mas quando Network I/O Control
está desabilitado, RTT
após o restransmission também voltou a ficar como o início.
Uma coisa estranha é que, embora eu defina MTU
para 9000, o tamanho dos pacotes UTP que são pacotes VxLAN incorporados é menor que 1600. Assim, o efeito de MTU 9000
não é afetado.
Estou em apuros. posso obter ajuda? Obrigado.
EDIT ---
Se as VMs estiverem normais, NSX
desativado, vDS
, tudo está bem.
EDITAR * Existe algum problema semelhante no OpenvSwitch?
Tags vmware-esxi tcpip openvswitch