Não é possível matar o VMware VM

4

Estou encontrando uma VM muito teimosa (2008R2, ferramentas VMware apenas um pouco desatualizadas, as que vieram com o 5.5U3a) em um cluster ESXi 6.0U2 em execução nos servidores Dell R630. Do lado de fora, a VM deixa de responder após algum tempo - pode ser um dia, pode ser uma semana - e não responde mais a pings, solicitações de conexão e assim por diante (ele executa um aplicativo industrial e alguns MSSQL). Esse comportamento já pode ser observado quando o cluster executou o 5.5U3a.

Então, tento reiniciar a VM por meio do web client ou do fat client. Nada acontece. Por horas. Próxima etapa de escalonamento:

esxcli vm process kill -w <worldID> -t soft

Nenhuma resposta, nenhuma mudança. Salte -t duro e vá diretamente para

esxcli vm process kill -w <worldID> -t force

Nenhuma resposta também. A máquina virtual continua se arrastando sem responder e tudo, mas o mundo simplesmente se recusa a ser morto. Não há mensagem de erro também. A reinicialização do host com a VM é o último recurso.

Como posso identificar a causa raiz desse comportamento muito estranho?

    
por mexell 11.08.2016 / 08:50

2 respostas

4

How can I identify the root cause for this very strange behaviour?

Método científico é seu amigo.

  1. Defina o problema que você deseja resolver. Parece que você tem dois problemas (possivelmente inter-relacionados). A VM não responde e o ESXi não pode matá-la.

  2. Coletar dados. Procure nos registros, seu monitoramento, etc., para obter informações relevantes.

  3. Analise os dados.

  4. Faça alterações com base em sua análise.

  5. Verifique se as alterações funcionam. Se eles não voltarem para 2 ou 3 e coletarem mais dados / reanálise.

  6. Documente suas descobertas.

por 11.08.2016 / 09:15
4

Depois de ter identificado o processo certo usando ps | grep vmx , você pode terminá-lo abruptamente via kill -9 <pid>

Tenha muito cuidado para selecionar (e matar) o processo correto. Para mais informações, dê uma olhada aqui

Se nada funcionar, de acordo com a documentação do VmWare, você teve que reiniciar o host ESX

    
por 11.08.2016 / 10:04