Como me preparo para trocar uma NIC usando a formação de equipes de rede em um host de cluster do Windows?

3

Atualizar : agora realizei a atualização. Eu usei a solução half-ninja, half-hack de conectar adaptadores USB-Ethernet que eu poderia adicionar às equipes para segurar o strong. Liguei um por equipe, removi os outros adaptadores afetados da equipe, desliguei o Windows, troquei o cartão, verifiquei se os adaptadores USB estavam na mesma porta USB e se conectaria da mesma maneira e inicializaria. Os adaptadores USB ainda estavam lá e consegui restaurar a configuração da equipe adicionando manualmente as novas NICs às equipes.

Esta solução foi proposta pela primeira vez por @ Drifter104 em um comentário. @ shouldbeq931 foi a primeira resposta a propor a adição de outro cartão para contornar o problema e receber a recompensa. Ambas as respostas foram úteis, então, para ser justo, estou assinalando a resposta exaustiva de @ llorrac como a resposta, que apontou a importância de remover as NICs do cartão quebrado das equipes antes de trocá-las.

Eu ainda não sei exatamente o que acontece quando você não faz isso ou o que é a orientação da Microsoft para trocar cartões - mas isso é culpa da Microsoft e agradeço a ajuda que recebi aqui.

Pergunta original : Estou administrando um cluster do Windows Server 2012 R2 que está executando cargas de trabalho do Hyper-V. Todos os nós de cluster têm várias redes, servidas por várias placas de rede físicas, onde Agrupamento de NICs é usado para agrupar duas portas (as equipes nunca ocupam as placas de rede física). Uma porta em uma placa de rede física em um dos nós do cluster sofreu recentemente uma falha e essa porta foi removida de sua equipe e uma nova placa de rede física de marca e modelo idênticos foi solicitada.

  • Se eu substituir o cartão como está e conectar tudo da mesma maneira, tudo será selecionado pela equipe de NICs? Por redes de cluster? A placa de rede física estará no mesmo slot e no mesmo modelo, mas os endereços MAC serão claramente diferentes, e não sei se as tags que a Dell colocou nas várias portas para correlacioná-las (há uma sigla para isso mas me escapa) estará disponível.

  • Se não, será necessário desativar tudo e reconfigurar as redes de equipes / cluster?

  • Existe alguma boa orientação oficial ou outro conselho sobre como fazer isso? Eu não encontrei nada, mas não sei bem o que procurar. (O mais próximo é este tópico do fórum que foi escrito quando a equipe de rede não foi fornecida pelo Windows Server e alguém precisou usar uma solução de hardware do fornecedor, então a resposta da Microsoft para essa situação foi "você está por sua conta".)

Edite: esperamos que esta pergunta responda à pergunta geral "a coisa quebra e, em caso afirmativo, como posso evitar isso?", mas percebo que mais detalhes serão úteis, por isso estou fornecendo-lhes.

O servidor tem um total de seis portas, divididas em dois cartões. Um cartão tem duas portas de 10 Gbit e uma equipe que abrange as duas portas. Um cartão tem duas portas de 10 Gbit e uma equipe que abrange as duas portas, além de duas portas de 1 Gbit e uma equipe que abrange as duas portas. A equipe de 1 Gbit está conectada ao nosso switch geral de rede. As duas equipes de 10 Gbit estão conectadas ponto a ponto diretamente ao nosso servidor de armazenamento e ao outro nó do cluster, e a rede funciona com endereços IP codificados e sem um switch. (Isso funciona mas eu não recomendaria, nem o repetiria em uma nova configuração. Então, sim, eu sei que é horrível e evita um monte de coisas úteis com a VLAN e a higiene da rede. Tanto quanto eu posso dizer que não tem um impacto sobre o que estou perguntando, que é como o agrupamento de NIC do Windows Server reage ao hardware alterado.) A porta com defeito está em uma das equipes de 10 Gbits. Todas as equipes usam o modo de equipe Switch Independent (já que não há switch).

    
por Jesper 03.08.2017 / 14:57

2 respostas

5

Esta é uma questão importante e eu diria um cenário mais comum do que aparece na sua pesquisa.

Como você deve saber, existem três tipos de agrupamento fornecidos pelo MS Server.  1. Ativo / Standby  2. Estático  3. LACP

Com base na sua declaração sobre se você terá que

tear everything down

me parece que você está usando o agrupamento estático, que requer mais configuração manual do que os outros dois.

Em relação à substituição da NIC.

Apesar de qual equipe você usa, você precisa ter certeza de que sua placa morta está desabilitada nas configurações da equipe antes de desconectar qualquer coisa !!!

Será escolhido pelo agrupamento quando você conectar a nova NIC? Sim, mas dependendo da configuração que você está usando, talvez seja necessário adicioná-lo manualmente à sua equipe.

  1. Remover NIC da equipe
  2. Remover o NIC físico
  3. Substituir NIC físico
  4. Adicionar nova NIC à equipe

Confira este documento da Microsoft tech net para referência - 4.6 Verificando o status de uma equipe . Existem opções para editar as configurações da equipe visualmente ou por meio do powershell.

Com relação ao endereço MAC e às redes de cluster.

Novamente, de acordo com a documentação, os destinatários dos dados agrupados resolverão o único IP e repousarão em um endereço MAC principal do pool. Dessa forma, se você seguir as etapas da documentação anexada, não deverá incorrer em erros com a configuração do endereço MAC.

Em resumo.

Uma vez tive que realizar uma revisão pós-incidente em uma situação semelhante. O engenheiro planejou desligar um interruptor para substituí-lo, mas não o removeu da piscina. Isso significa que, quando ele desligou o switch, todo o tráfego de rede foi perdido e causou erros em dispositivos de usuário final de + 250k. ¯_ (ツ) _ / ¯

Confira os documentos - há algumas outras coisas específicas para o hyper-v que podem fazer mais sentido para você.

    
por 08.08.2017 / 14:17
2

O Windows abstrai as NICs subjacentes em uma Equipe, quando uma NIC é removida de uma equipe e a nova NIC adicionada à Equipe, a Equipe permanece a mesma, desde que haja uma NIC na equipe que a configuração da Equipe dura. Se você remover todas as NICs de uma equipe, não haverá equipe restante.

Dependendo da sua configuração, capacidade de manutenção de janelas e slots PCIe gratuitos, talvez você prefira adicionar uma NIC adicional à equipe antes de remover a NIC com falha.

Sempre construo equipes em várias NICs para que, no caso de falha da NIC, a equipe permaneça ativa. Também tenho a tendência de criar equipes sobre diferentes fornecedores de NICs, de modo que, no caso de um driver de NIC "defeituoso" ser implantado, a equipe ainda permanecerá ativa

    
por 09.08.2017 / 01:50