Ótima pergunta!
O motivo mais provável para a falha de RPC é que o recurso de nome de cluster (e o endereço IP) provavelmente estava hospedado no servidor cuja conexão de rede principal estava oscilando.
Como a interface estava indo para cima e para baixo, o acesso ao cluster por meio do nome do cluster provavelmente falharia devido às interrupções da rede.
Você deve conseguir executar comandos no cluster a partir da linha de comando (cluster.exe ou o módulo FailoverClusters no PowerShell). O módulo FailOverClusters pode ser usado sobre o controle remoto do PowerShell se a delegação de credenciais apropriada estiver configurada (CredSSP ou Kerberos).
No caso de uma falha da interface de rede que hospeda o nome do cluster, você poderia usar o PowerShell para mover esse grupo de clusters para um dos nós acessíveis ou executar comandos contra o cluster para migrar máquinas, etc. ..
Para garantir que isso não aconteça novamente, você provavelmente precisará tornar a NIC altamente disponível (agrupamento de NICs). Isso depende de onde você está gerenciando o cluster a partir de um dos servidores ou de uma estação de gerenciamento remoto. Se você estiver gerenciando de uma máquina em cluster no mesmo cluster, poderá adicionar um IP na rede do cluster ao nome do cluster, mas deseja certificar-se de que não foi adicionado ao DNS; caso contrário, poderá interromper os clientes de gerenciamento remoto. capaz de se conectar.
Para adicionar um endereço IP ao grupo de clusters por meio do PowerShell -
$Resource = Add-ClusterResource -Name SecondaryIP -ResourceType "IP Address" -Group 'Cluster Group'
$Resource | Set-ClusterParameter -Name 'Address' -Value 'Your-IP-Here'
$Resource | Set-ClusterParameter -Name 'SubnetMask' -Value 'Your-SubnetMask-Here'
Você precisará desabilitar o registro de DNS dinâmico e criar entradas estáticas se não quiser que os clientes de gerenciamento remoto tentem falar com a rede privada.