Isso soa como um problema de armazenamento local para mim. Eu trabalhei em um ambiente com centenas de hosts ESXi que rodavam em armazenamento RAID local. Infelizmente, os controladores de armazenamento locais no hardware eram instáveis ... uma mistura tóxica de revisões incorretas de firmware LSI, backplanes defeituosos e hardware Supermicro.
Mas o comportamento que você descreve é indicativo de um problema de armazenamento local. Suas VMs em execução estão na RAM, a pilha de rede não é afetada, mas a capacidade de gerenciar o host fica comprometida. Seu login não funciona porque o host não pode ler do disco local. A mesma coisa para qualquer outro comando que exija acesso ao disco.
Sua melhor opção aqui é agendar um desligamento ordenado das VMs (a partir dos sistemas operacionais convidados). A partir daí, falha manualmente o host (desligamento, reinicialização, etc.) Deixe-o permanecer no modo de manutenção ou fora da seleção do cluster. Ative suas VMs e permita que elas sejam executadas em outro lugar no cluster do vSphere.
Se você estiver interessado em depurar os problemas do host, verifique o Dell DRAC para obter informações sobre o status do storage array. Isso vai te apontar na direção certa.