Convidado Replicado do Hyper-V preso à mesclagem no Hyper-V 2016

3

Desde a atualização de alguns servidores host para o Hyper-V Core 2016, tenho tido alguns problemas com replicação junto com pontos de verificação.

No meu exemplo atual, tenho um convidado do Hyper-V replicado (Gen2, V5.0). Nós executamos um processo de backup noturno que pegará um ponto de verificação da réplica, copiará os arquivos VHDX para um armazenamento de backup e excluirá o ponto de verificação.

Algumas noites, o convidado parece ficar preso ao aplicar alterações de réplica e não permitirá que o ponto de verificação seja excluído. Nosso processo de backup irá aguardar até que a máquina termine de aplicar as alterações, mas, neste caso, isso nunca acontece e o convidado da réplica fica preso em "Aplicando Delta Registrado ..." na coluna Status do Gerenciador Hyper-V. A replicação se torna crítica e as alterações não são mais replicadas, pois o backlog é muito grande.

Captura de tela do Gerenciador do Hyper-V exibindo o convidado com "Aplicar Delta Registrado ..." como o status

Por meio do front-end, tenho a capacidade de clicar com o botão direito do mouse e selecionar "Cancelar a aplicação de alterações de réplica", mas usei isso anteriormente e ele não tem efeito além de remover a opção do menu. A única solução que descobri até agora é reiniciar completamente o host.

Eu tentei reiniciar o serviço VMMS, pois problemas semelhantes no passado se resolveram depois disso, mas, nesse caso, o serviço congela com o status "Parando" e não pode mais interagir. Eu tive que fazer uma reinicialização a frio para recuperar como o host ficou preso fazendo uma reinicialização suave.

Estou um pouco confuso agora, pois isso interrompeu meus planos de upgrade até que eu possa resolver esse problema, e não consigo encontrar ninguém postando sobre o mesmo problema no Hyper-V 2016.

Outros pontos de interesse:

  • Isso não é específico para apenas um dos hosts ou um dos convidados
  • O problema ocorrerá se o convidado for v5 ou v8
  • Esse problema ocorrerá se o host de origem for o Hyper-V 2012 ou o Hyper-V 2016
  • Este problema não ocorreu / não ocorre no núcleo 2012R2 do Hyper-V

  • Há muito espaço em disco restante (> 600 GB)

  • A replicação é configurada para manter os pontos de verificação 24 horas e as alterações são replicadas a cada 30 segundos.
  • O host tem vários convidados em execução e convidados replicados, mas o problema ocorreu em um host em que ele tinha apenas um convidado replicado.
  • As atualizações mais recentes do Windows foram aplicadas.
  • Isso parece acontecer principalmente em convidados grandes que provavelmente estarão replicando a maioria das alterações. Eu tive que ocorrer em um convidado menor.

UPDATE

Esse problema também ocorreu com "Como aplicar alterações de réplica ..." na coluna de status, em vez do status "Aplicar Delta registrado ...".

ATUALIZAÇÃO 16/06

Encontrei um ou dois artigos com problemas semelhantes que sugeriam que o Windows Defender era o culpado. Eu desinstalei isso do servidor, mas o problema ocorreu novamente depois de alguns dias.

ATUALIZAÇÃO 20/06

Encontrei uma postagem no fórum AQUI descrevendo um problema muito semelhante. O problema estava ocorrendo quando o Windows Defender foi desabilitado em uma instalação do Windows Server 2016. Eles fizeram os seguintes testes:

  1. Windows 2016 Datacenter with latest updates on source and destination with >Trend Antivirus installed and NO Windows Defender - Replication breaks after >initial replication and causes Hyper-V Management service to go unresponsive.

  2. Windows 2016 Datacenter with latest updates on source and destination with NO >Trend and NO Windows Defender - Replication breaks after initial replication and >causes Hyper-V Management service to go unresponsive.

  3. Windows 2016 Datacenter with latest updates on source and destination with >Widows Defender and NO Trend - Replication works normally.

  4. Windows 2016 Datacenter with latest updates on source and destination with >Widows Defender and Trend Installed (Trend Disables Windows Defender) - >Replication breaks after initial replication and causes Hyper-V Management >service to go unresponsive.

Agora estou pensando se talvez o meu problema possa estar relacionado a um recurso principal do Windows Defender que não está em execução ou não está presente no Hyper-V Core 2016. Estou chegando rapidamente ao ponto em que precisarei fazer o downgrade 2016 de volta para 2012.

ATUALIZAÇÃO 4 de julho

Eu comecei o processo de rebaixamento para o Hyper-V Core 2012 R2, pois toda essa situação era insustentável. Espero que a Microsoft resolva esse problema em uma atualização ou na versão 2016 R2.

    
por Kez Floyd 30.05.2017 / 12:22

2 respostas

0

Eu consegui recuperar deste estado várias vezes como. Isso pode não funcionar se você já tentou matar qualquer um dos serviços:

  • Faça o download do PSExec em site da Microsoft Sysinternals
  • Ir para o Gerenciador de tarefas - > Guia Serviços.
  • Anote os números PID para 'vmms', 'Winmgmt' e 'WinRM'
  • Usando uma janela de comando com acesso de Administrador, inicie o PSExec com o comando psexec.exe /i /s cmd.exe . Isso cria uma nova janela de comando que está sendo executada na conta "SYSTEM"
  • Na nova janela de comando, execute o comando taskkill /f /pid #### para cada um dos PIDs na etapa anterior.
  • Use o Gerenciador de tarefas - > Guia Serviços para iniciar todos os três serviços novamente. Ignore qualquer um que tenha iniciado a si próprio.
  • Os status "Aplicando Delta registrado" desaparecerão das VMs e agora devem ser configuráveis.
por 30.07.2018 / 13:20
1

Estou tendo o mesmo problema e isso é com um SQL Server realmente grande. Como a réplica inicial de sementes demorou quase dois dias, não consigo aceitar a falha. Chegou a 99% e, em seguida, começou a "Aplicar alterações de réplica ..." Nada parecia estar acontecendo e ele se deteve. Eu imediatamente cliquei em currículo e ele mostrou Merge in Progress na VM ao vivo e chegou a 21% onde ficou preso. Cancelei a fusão e depois parei novamente e retomei novamente. É agora uma hora mais tarde e quando ele faz uma pausa eu continuo (Eu tenho agendado "Resume-VMReplication *" para executar a cada 15 minutos no powershell para que eu possa ir dormir.

Eu cancelei a mesclagem após o que parece replicar as alterações e, em seguida, começar a mesclar novamente. A mesclagem agora foi movida para 22%, o que eu deixarei executar por 10 minutos antes de cancelá-la novamente e assim o ciclo de vida continuará até que eu desmaie ou a mesclagem e a replicação sejam concluídas.

Eu tenho usado a replicação do HyperV 2012R2 por anos no mesmo servidor de tamanho e isso não é problema. Eu tive que fazer o inevitável e passar para o HyperV 2016 e o Gd nos ajudar talvez eu tenha que reverter e esperar por 2016R2:)

Eu atualizarei você se tiver algum sucesso amanhã, mas por enquanto bons sonhos

    
por 11.06.2017 / 22:59