Para possíveis estratégias de debbuging, este é o meu conselho:
Teste o disco extensivamente a partir de uma mídia Linux ao vivo. Ter um disco somente leitura, é um sintoma ruim de corrupção de mídia. Com (muito) azar, você tem erros no setor do disco rígido, no entanto, o fato de estar nos dizendo que a imagem do vmware veio de uma máquina travada pode significar que a VM / vmdk subjacente está corrompida ou, pior ainda, binários corrompidos.
Eu migraria / reinstalaria para outra máquina sem usando mecanismos de importação / exportação de vmware, e sem copiando o vmdk se não consegui encontrar defeitos de disco físico subjacentes (no host vmware).
Quanto aos logs de arquivos, eles deixam de ser significativos assim que o kernel ativa a montagem somente leitura para proteger a integridade dos dados. Redirecionar erros do syslog para outro servidor syslog
e para outro console virtual (algumas distribuições redirecionam os logs para um console virtual por padrão ). Com sorte, você poderá ver um registro de erros dando uma pista da causa.
Ainda sobre logs, você não mencionou logs do vmware . Se houver defeitos no disco físico subjacente, eles aparecerão nos logs do vmware - afinal, a VM está vendo apenas uma imagem de disco virtual fornecida pelo hypervisor vmware. Vá para o console do terminal vmware e assista-os. Se possível, redirecione os logs vmware também para outro servidor syslog para assisti-los regularmente.
Quanto à manutenção contínua, é recomendável instalar agentes SNMP e usar cactos, observium ou o que você quiser, para obter linhas de base de uso regular dos recursos. Isso também pode ser útil em caso de problemas e também pode enviar alertas automatizados.