Qual é a maneira correta de corrigir um cluster de HA?

3

Plano de fundo / meta

  • Eu tenho um cluster VMware HA para máquinas de produção com dois hosts.
  • No momento, ele está configurado para que seja possível contabilizar a falha de até um host. Não usa DRS.
  • Preciso corrigir esses dois servidores para aplicar patches. Eu gostaria de fazer isso sem tempo de inatividade.

Perguntas

  • Posso mover as VMs no cluster especificamente para outro host no cluster e, em seguida, desativar um servidor?
  • Qual é a maneira melhor / recomendada de corrigir servidores em uma configuração de HA para evitar tempo de inatividade?
por SeanKilleen 19.12.2012 / 16:03

3 respostas

7

Se você não estiver usando o DRS, terá que evacuar manualmente as VMs ativadas para outro host no cluster antes que o VUM resolva o host. Também é recomendável que, se você estiver usando o Controle de Admissão de HA, o Gerenciamento de Energia Distribuída ou a Tolerância a Falhas, desative esses recursos antes de corrigir o host.

Resumindo, migre (vMotion) suas VMs ativadas para outro host no cluster, corrija o host e migre as VMs de volta.

    
por 19.12.2012 / 16:25
3

Desative as opções corretas nas telas de opções de correção de host / cluster:

Eu normalmente desabilito o controle de admissão, a tolerância a falhas e o DPM (mas quem usa isso ?)

Eu posso manualmente vMotion algumas VMs se o processo não parece ser iniciado.

Seja paciente. Demora até 10-15 minutos por host, dependendo da sua conectividade.

    
por 19.12.2012 / 16:49
0

Quando você corrige um host em um cluster, o host entra no modo de manutenção, que então envia as VMs para outro host e inicia o processo de atualização. O host sairá do modo de manutenção quando o processo de atualização for concluído. Você pode, então, fazer uma atualização de host rotativo, por assim dizer. Você não precisa desativar as VMs, embora possa fazer isso, mas não acredito que essa etapa seja necessária. Portanto, no seu caso, desde que você tenha capacidade no outro host, você poderá corrigir o primeiro host, aguardar a conclusão do processo updfate (exibir as tarefas e eventos para obter informações detalhadas) e depois fazer o outro host

    
por 19.12.2012 / 16:48