Risco mínimo e tempo de inatividade podem ser termos subjetivos neste caso e também podem ser limitados pelos recursos disponíveis.
A maneira ' ideal ' de atualizar sem tempo de inatividade e riscos mínimos para os dados da VM envolveria vários servidores, pelo menos 3, possivelmente mais, dependendo dos requisitos de carga e armazenamento:
- Armazenamento de back-end para VMs, de preferência não em um hypervisor, imagens de máquina virtual e instantâneos podem ser armazenados aqui, bem como dados que poderiam ser acessados por várias VMs.
- Dois sistemas hipervisor
- Dependendo do número total de hipervisores, requisitos de ES, armazenamento necessário, uma rede dedicada de alta velocidade entre os hipervisores e os servidores de armazenamento pode melhorar o desempenho
Quando os sistemas estiverem prontos, é relativamente simples migrar uma VM ativa . Depois que a migração do servidor0 para o servidor1 tiver ocorrido e tudo for verificado para estar sendo executado corretamente no servidor1, os serviços relevantes no servidor0 poderão ser interrompidos e atualizados.
Se você tiver os recursos para configurar esse tipo de infraestrutura, poderá haver muitas vantagens em executar hipervisores / pools de VMs dessa maneira. Ter um processo testado e documentado para migrar VMs entre hipervisores permitirá agendar manutenção regular e tempo de inatividade nos hipervisores. As atualizações e a manutenção planejadas permitem que você fique por dentro das atualizações que podem afetar a segurança e o desempenho.
A configuração mínima da infra-estrutura para permitir a migração temporária de serviços entre hypervisors pode reduzir o impacto e a visibilidade para os clientes se / quando os patches de segurança críticos precisarem ser aplicados aos sistemas de produção.
Nos casos em que algum tempo de inatividade é aceitável e a infraestrutura para um cenário de atualização ' ideal ', eu geralmente obtive êxito usando esse processo, embora o problema imprevisto ocasional possa ocorrer; Com base na experiência passada, manter uma Hot Spare , se possível, para sistemas e infraestruturas críticos é sempre uma boa ideia. Eu usei algumas variações deste conjunto de etapas com o KVM e o Xen no openSUSE e no CentOS:
- Verifique se todos os backups e instantâneos de VMs estão atualizados
- Desligamento executando VMs da maneira mais agradável possível
- Atualizar / corrigir o hipervisor
- Reinicialize o hipervisor, não sendo estritamente necessário, embora, dependendo das atualizações realizadas, essa seja a maneira mais fácil de garantir que todas as alterações entrem em vigor.
- Acompanhe a sala do servidor enquanto aguarda o hipervisor reiniciar
- Reinicie as VMs
- Teste para ver se tudo está funcionando