Um host de balanceamento de carga de rede não pode ver o outro

1

Nós configuramos um cluster de balanceamento de carga de rede (NLB) do Windows de dois hosts para nosso novo ambiente de preparo. Inicialmente, o cluster funciona bem, mas, eventualmente, após parar e iniciar um dos hosts por meio de nosso script de implantação automatizado, o primeiro host não consegue mais ver o segundo host. Portanto, se você abrir o Gerenciador NLB no Host1, o Host2 não ficará visível. Isso não acontece se você abrir o Gerenciador NLB no Host2. Editar: Na verdade, às vezes o Host2 também não pode ver o Host1. Quando isso acontece, o cluster não responde completamente às solicitações.

Coisas que notamos durante o "estado ruim":

  • Os hosts podem pingar um ao outro.
  • O RPC funciona porque consigo acessar o compartilhamento C $ de um host de outro.
  • Se eu tentar adicionar manualmente o Host2 ausente ao Host1, ele diz que ele já existe. Eu posso clicar em Cluster > Conecte-se a Existente e especifique Host2, que funciona, mas somente até eu fechar o Gerenciador NLB e abri-lo novamente.
  • Quando o cluster está em mau estado, se eu tentar iniciar o Host2, ele diz "Convergindo", mas nunca muda para "Convergido".

As coisas que tentamos não resolveram o problema:

  • Removeu todas as coisas do NLB e recriou a configuração do zero.
  • Removemos e adicionamos novamente o adaptador de rede no Gerenciador de dispositivos em um dos hosts.
  • Mudar de multicast para unicast.
  • Reconstrua a VM do segundo nó do zero.

Reiniciar os servidores parece consertá-lo temporariamente, até que isso aconteça novamente.

Configuração:

  • Os dois hosts estão executando o Windows Server 2012 R2 com as atualizações mais recentes a partir de 2015-09-21. Antes da configuração do NLB, o segundo host era clonado a partir de uma imagem do primeiro host.
  • Ambos os hosts estão sendo executados como convidados VMWare no mesmo host VMWare. Não tenho certeza da versão do VMWare (que cabe aos nossos administradores), mas as ferramentas VMWare nos sistemas operacionais convidados dizem que a versão 9.4.
  • Cada host possui um único adaptador Ethernet com 2 IPs atribuídos: o IP dedicado do host e o IP do cluster.
  • Regras de porta: Multicast, apenas portas 80 e 443, Load Equal, Affinity Single
por Jordan Rieger 21.09.2015 / 22:27

1 resposta

1

Eu tenho visto esse tipo de comportamento usando Multicast em um par de switches, onde cada host físico está conectado apenas a um ou outros switches. A configuração de switch padrão interrompe a conversação dos servidores NLB. Tivemos que aplicar uma configuração de switch para fazê-los falar.

A verificação rápida é configurá-los para o Unicast primeiro. Se isso funcionar, veja a configuração do switch.

    
por 25.09.2015 / 18:51