O comportamento do vSphere para cada tecnologia é definido na documentação. Você, no entanto, parece ter uma visão incorreta do que essas tecnologias são projetadas. Tanto o VMWare HA quanto o VMWare FT são projetados principalmente para fornecer a disponibilidade dos convidados no caso de falhas do host.
If a master host is unable to communicate directly with the agent on a slave host, the slave host does not respond to ICMP pings, and the agent is not issuing heartbeats it is considered to have failed. The host's virtual machines are restarted on alternate hosts. If such a slave host is exchanging heartbeats with a datastore, the master host assumes that it is in a network partition or network isolated and so continues to monitor the host and its virtual machines
A transparent failover occurs if the host running the Primary VM fails, in which case the Secondary VM is immediately activated to replace the Primary VM. A new Secondary VM is started and Fault Tolerance redundancy is reestablished within a few seconds. If the host running the Secondary VM fails, it is also immediately replaced. In either case, users experience no interruption in service and no loss of data.
Em suas perguntas específicas:
- What happens to the failed VM that has been configured for High Availability (HA)? for Fault Tolerance (FT)? Is it automatically stopped and are their resources released (but restarted (HA) or secondary instance takes over (FT))?
O VMWare HA e o FT são voltados para a recuperação de uma falha do host. Você não configura uma VM para HA - você configura os hosts. Em uma falha de host, o HA reiniciava o convidado em um host diferente. O vCenter também pode fazer um monitoramento de pulsação de convidado limitado (com ferramentas VMWare) que também pode acionar uma redefinição da máquina convidada no mesmo host. Em ambos os casos, não é um desligamento limpo e é tratado como um ciclo de desligamento / reinicialização consistente de falha.
O FT cria um guest duplicado rodando em sincronia com a fonte. No caso de uma falha de host, o convidado secundário assumirá automaticamente e o vCenter criará um novo secundário (se possível). O monitoramento de pulsação do convidado não é feito, pois quaisquer alterações que causassem a queda do primário seriam duplicadas no secundário. O FT é estritamente para fornecer acesso aos convidados em caso de falhas de host.
- What are the typical methods to debug what has happened to a failed VM? Through logs or a VMware VM monitoring UI? Would the user be notified of the VM failure?
Como é frequentemente o caso, isso depende. A solução de problemas / depuração típica envolve a exibição de mensagens de erro. Se você quiser ir além das técnicas gerais de solução de problemas, provavelmente vai além do escopo deste site. Os usuários finais do convidado não seriam notificados. Os administradores do vCenter podem ser notificados se você tiver a configuração de alerta e estiver configurada corretamente no vCenter ou se estiver usando outras ferramentas de monitoramento de terceiros.
- Is it possible to clone a VM before it is restarted or failed over to later debug what happened to it?
Como o HA e o FT são voltados para fornecer falhas de HOST, isso não é possível dentro dos limites das tecnologias integradas.