Estamos tendo um comportamento estranho em nosso cluster ESX:
A infraestrutura:
temos 2 ESXi 5.5.0 build 2718055 em um cluster, gerenciado pelo vCenter. Estamos usando uma licença do Essentials, por isso não temos switches distribuídos. A rede da nossa empresa tem várias vlans, das quais cerca de 10 são necessárias em servidores vm. O hardware é das portas eth HP DL380 Gen8, 8 de 1 Gb. As portas do switch (Cisco 2960E e 3850E) conectadas aos servidores são configuradas com o cisco trunk vlan - todos os pacotes chegam com sua tag vlan. A rede physikal é completamente redundante, um dos dois switches E uma das duas placas de rede em um servidor pode falhar sem travar as VMs.
Todos os switches são configurados da mesma forma,
Estou usando 2 comutadores virtuais (em cada host), cada comutador atribuiu
O problema
Quando eu reinicializo um vm, colocado em esx1 e com configuração automática de endereço IP, a máquina não recebe uma conexão DHCP - a conexão de rede está disponível, se eu definir um endereço IP manual tudo funciona bem, mas pconfig /refresh
é haning, e DHCPExplorer não encontra um servidor dhcp válido (que eu posso pingar se eu atribuir um endereço IP manual).
Agora eu tenho que migrar a máquina para esx2 e esperar por algum tempo (ou fazer ipconfig /renew
ou desativar e ativar o nic) a máquina irá obter um endereço dhcp. Depois disso, posso mover a máquina de volta para esx1 e ela funcionará perfeitamente bem. Depois disso, até obtive resultados positivos do explorador do dhcp.
Eu estava então testando se o comportamento estava conectado à parte física da rede: eu removi todas as nics físicas, mas uma do portgroup com a vlan afetada, fiz algumas reinicializações com uma máquina dhcp e, em seguida, testei com outra - em suma, forcei todo o tráfego desse grupo de portas a passar por uma porta física do nic e do switch.
O resultado foi: o problema ocorre apenas em duas portas diferentes em duas nics diferentes, mas ambas estão conectadas ao mesmo switch.
Parece-me que esta opção está, de alguma forma, bloqueando o acesso ao serviço dhcp. Alguém viu um comportamento como esse? Estou saindo de oppções - em breve queremos atualizar para o ESX 6, mas como também temos o VMWare View Desktop Virtualization, o processo de atualização incluirá muito trabalho e testes e não poderá ser feito rapidamente ...
EDITAR:
Como a configuração visual de nossos switches é muito grande para a tela, eu fiz uma exportação dos switches virtuais e grupos de portas via powershell.
O host problemático é o host-1002, as nics problemáticas que identificamos são vmnic4 e vmnic8, os grupos de portas em que o problema foi observado são PortGroup35 e PortGroup41
Get-Virtualswitch|select Name, ID, NumPorts, NumPortsAvailable, Nic, MTU, VMHostID
RESULTADO:
Name : vSwitch0
Id : key-vim.host.VirtualSwitch-vSwitch0
NumPorts : 4352
NumPortsAvailable : 4309
Nic : {vmnic7, vmnic0, vmnic2, vmnic9}
Mtu : 1500
VMHostId : HostSystem-host-1001
Name : vSwitch2
Id : key-vim.host.VirtualSwitch-vSwitch2
NumPorts : 4352
NumPortsAvailable : 4309
Nic : {vmnic3, vmnic1, vmnic6, vmnic8}
Mtu : 1500
VMHostId : HostSystem-host-1001
Name : vSwitch5
Id : key-vim.host.VirtualSwitch-vSwitch5
NumPorts : 4352
NumPortsAvailable : 4309
Nic : {vmnic4}
Mtu : 1500
VMHostId : HostSystem-host-1001
Name : vSwitch0
Id : key-vim.host.VirtualSwitch-vSwitch0
NumPorts : 4352
NumPortsAvailable : 4304
Nic : {vmnic7, vmnic3, vmnic5, vmnic9}
Mtu : 1500
VMHostId : HostSystem-host-1002
Name : vSwitch2
Id : key-vim.host.VirtualSwitch-vSwitch2
NumPorts : 4352
NumPortsAvailable : 4304
Nic : {vmnic8, vmnic4, vmnic6, vmnic2}
Mtu : 1500
VMHostId : HostSystem-host-1002
Name : vSwitch5
Id : key-vim.host.VirtualSwitch-vSwitch5
NumPorts : 4352
NumPortsAvailable : 4304
Nic : {vmnic1}
Mtu : 1500
VMHostId : HostSystem-host-1002
Get-Virtualportgroup|select Name, VirtualSwitchId, Key, VLANId, VMHostID
RESULTADO:
Name : PORTGROUP82
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch0
Key : key-vim.host.PortGroup-PORTGROUP82
VLanId : 82
VMHostId : HostSystem-host-1001
Name : PORTGROUP90
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch0
Key : key-vim.host.PortGroup-PORTGROUP90
VLanId : 90
VMHostId : HostSystem-host-1001
Name : PORTGROUP83
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch0
Key : key-vim.host.PortGroup-PORTGROUP83
VLanId : 83
VMHostId : HostSystem-host-1001
Name : PORTGROUP16
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch0
Key : key-vim.host.PortGroup-PORTGROUP16
VLanId : 16
VMHostId : HostSystem-host-1001
Name : Management Network
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch0
Key : key-vim.host.PortGroup-Management Network
VLanId : 41
VMHostId : HostSystem-host-1001
Name : PORTGROUP80
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch2
Key : key-vim.host.PortGroup-PORTGROUP80
VLanId : 80
VMHostId : HostSystem-host-1001
Name : PORTGROUP41
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch2
Key : key-vim.host.PortGroup-PORTGROUP41
VLanId : 41
VMHostId : HostSystem-host-1001
Name : PORTGROUP35
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch2
Key : key-vim.host.PortGroup-PORTGROUP35
VLanId : 35
VMHostId : HostSystem-host-1001
Name : VMkernel
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch5
Key : key-vim.host.PortGroup-VMkernel
VLanId : 0
VMHostId : HostSystem-host-1001
Name : PORTGROUP43
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch0
Key : key-vim.host.PortGroup-PORTGROUP43
VLanId : 43
VMHostId : HostSystem-host-1001
Name : PORTGROUP82
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch0
Key : key-vim.host.PortGroup-PORTGROUP82
VLanId : 82
VMHostId : HostSystem-host-1002
Name : PORTGROUP83
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch0
Key : key-vim.host.PortGroup-PORTGROUP83
VLanId : 83
VMHostId : HostSystem-host-1002
Name : PORTGROUP90
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch0
Key : key-vim.host.PortGroup-PORTGROUP90
VLanId : 90
VMHostId : HostSystem-host-1002
Name : PORTGROUP16
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch0
Key : key-vim.host.PortGroup-PORTGROUP16
VLanId : 16
VMHostId : HostSystem-host-1002
Name : Management Network
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch0
Key : key-vim.host.PortGroup-Management Network
VLanId : 41
VMHostId : HostSystem-host-1002
Name : PORTGROUP80
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch2
Key : key-vim.host.PortGroup-PORTGROUP80
VLanId : 80
VMHostId : HostSystem-host-1002
Name : PORTGROUP41
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch2
Key : key-vim.host.PortGroup-PORTGROUP41
VLanId : 41
VMHostId : HostSystem-host-1002
Name : PORTGROUP35
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch2
Key : key-vim.host.PortGroup-PORTGROUP35
VLanId : 35
VMHostId : HostSystem-host-1002
Name : VMkernel
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch5
Key : key-vim.host.PortGroup-VMkernel
VLanId : 0
VMHostId : HostSystem-host-1002
Name : PORTGROUP43
VirtualSwitchId : key-vim.host.VirtualSwitch-vSwitch0
Key : key-vim.host.PortGroup-PORTGROUP43
VLanId : 43
VMHostId : HostSystem-host-1002
EDIT: NOVAS INFORMAÇÕES
Agora eu percebi, porque o problema está acontecendo apenas na esx1: o servidor dhcp para essas máquinas é um vm, colocado na esx2. Assim, as solicitações dhcp de máquinas no esx2 não precisariam nem sair do comutador virtual. Se eu mover o servidor dhcp para esx1, o problema é resolvido lá e começando em esx2. Ainda apenas um switch é afetado, o outro está funcionando bem. Então, na minha opinião, o problema definitivamente está no interruptor físico, não no virtual.