Algumas outras coisas que você pode testar:
Tente desligar as caixas (desligue a energia para obter uma simulação melhor). Além disso, desconecte os cabos da rede e desative a conexão entre os servidores.
(apesar de admitir, geralmente é o software que parece causar um failover)
para definir políticas de reinicialização:
Abra o Administrador de Cluster.
Na árvore do console, clique na pasta Recursos.
No painel de detalhes, clique no recurso desejado.
No menu Arquivo, clique em Propriedades.
Na guia Avançado, faça as alterações desejadas.
Parece que você deseja examinar as seguintes configurações: tempo limite, limite de failover e período de failover para recursos. O tempo limite controla quanto tempo o serviço Cluster aguarda o encerramento do recurso. O limite de failover e o período controlam quantas vezes o serviço de cluster tenta fazer failover de um recurso em um determinado período de tempo.