Processos que sobrevivem à reinicialização da VM do Windows?

1

Resumo: Um sistema virtual Windows Server 2012 de longa duração neste fim de semana ficou muito lento; do remoto, fizemos Restart-Computer -ComputerName xyzzy -Force , o que foi bem sucedido por todas as contas; exceto que alguns processos parecem ter sobrevivido a pelo menos 10 reinicializações .

E como esta é a primeira vez que vejo isso em mais de 20 anos usando o Windows, gostaria realmente de saber o que aconteceu.

Aqui está uma história cronológica:

  • Este sistema foi reinicializado pelo menos 10 vezes entre 8 de agosto de 2014 e 19 de janeiro de 2015. A última reinicialização ocorreu em 16 de janeiro.
  • A VM, que está sendo executada no VMware ESXi 5.5.0, quase não podia mais ser acessada por meio de UIs baseadas na Web e Área de Trabalho Remota: seu comportamento sugeria que alguns processos ou processos estavam ocupando a CPU.
  • Decidimos reinicializar o servidor de outro sistema Windows, usando o Powershell: Restart-Computer -ComputerName xyzzy .
  • Isso levou um bom tempo e, em seguida, retornou um erro indicando que os usuários ainda estavam conectados.
  • Justo, vamos aplicar força: Restart-Computer -ComputerName xyzzy -Force .
  • Isso levou um bom tempo e depois retornou.
  • Nesse meio tempo eu tive um ping -t xyzzy em execução, para verificar se a interface de rede iria cair, para verificar se a reinicialização realmente ocorreu. Por um minuto ou dois que repetidamente me deram Request timed out. e então as respostas do ping foram retomadas.
  • Então, conectei-me com êxito à Área de Trabalho Remota. Isso mostrou um diálogo dizendo que o sistema foi desligado inesperadamente e me pediu para preencher o motivo.
    • Isso foi um pouco inesperado, mas pode ser padrão após um controle remoto Restart-Computer .
  • Para descobrir o motivo dessa caixa de diálogo, verifiquei o visualizador de eventos e não pude encontrar nada de errado. E observei todos os tipos de inicialização do kernel e muitos eventos relacionados, relatando uptime de 20 segundos e 79 segundos.
  • (nada por um tempo)
  • Em seguida, observamos que o sistema estava ficando lento novamente, e eu me conectei com o Remote Desktop e dei uma olhada no Process Explorer. Isso resultou no seguinte:

    Acolunamaisàdireita,comdatasde1/19(19dejaneirode2015)e8/14(14deagostode2014),éacoluna"Hora de início" do Process Explorer e classifiquei essa coluna.

  • Em agosto de 2014 parece uma data realista de quando reinicializamos este sistema pela última vez Essa mesma data-hora também foi observada por outro processo que gerencia os processos java.exe mostrados: relatou processos iniciados há 158 dias. E de acordo com o Process Explorer, esses foram alguns dos processos que estavam consumindo CPU e tornando o sistema lento. Por fim, os arquivos de log por processo dos processos java.exe 3248, 4568 e 4236 não fornecem nenhuma indicação de que esses processos foram interrompidos: eles têm mensagens de log de 14 de agosto de 2014 e dos primeiros minutos após a reinicialização .

Então eu posso chegar a apenas uma conclusão: o sistema reinicializou por cerca de 90%, incluindo a pilha de rede e algo que grava eventos de inicialização do kernel, mas 10 processos sobreviveram à reinicialização .

Então, o que poderia razoavelmente ter causado isso?

Houve talvez uma estranha combinação de uma antiga imagem / instantâneo de VMware de agosto de 2014 e uma inicialização recente? Observe que o VMware não possui um instantâneo para este sistema.

Observe que, como o sistema estava se tornando inutilizável novamente, eu fiz um Restart-Computer -Force localmente, causando uma reinicialização e, desta vez, não houve processos restantes. Então, tudo parece bem agora, mas eu não tenho mais o sistema ao vivo: só posso fazer perícia.

    
por Marnix Klooster 19.01.2015 / 16:54

0 respostas