Por ser um produto proprietário, não acho que você esteja analisando o protocolo em nível binário ou mesmo diagramas de fluxo, mas acho que você pode coletar algumas informações úteis de:
-
O design e a arquitetura do Microsoft Cluster Service - Este artigo, co-escrito por Um dos meus heróis da CompSci, Jim Gray (RIP, Jim), publicado no 1998 IEEE Proceedings of FTCS, descreve o design básico do produto Microsoft Cluster Server como era no Windows NT 4.0, do qual todos os produtos posteriores evoluíram. Há até mesmo um diagrama de fluxo aqui, embora esteja provavelmente desatualizado em relação às gerações atuais do produto.
-
Detecção e recuperação de falhas de rede em um cluster de dois nós do Windows Server 2000 - Este artigo, embora datado descreve os detalhes de baixo nível da máquina de estado usada para determinar a disponibilidade da rede de nós em um cluster.
-
[MS-CMRP]: cluster de failover: API de gerenciamento (ClusAPI) Protocol Specification - Este documento faz declarações sobre como o produto funciona internamente, pensando que seu objetivo não é documentar especificamente os fluxos e protocolos de comunicação dentro do cluster.
-
Essa funcionalidade ficou mais configurável em versões posteriores do produto. Procurando pelo nome da ferramenta de gerenciamento de linha de comando,
cluster.exe
e A palavra "heartbeat" direcionada contra o site da Microsoft parece dar muitos resultados potencialmente bons ( um dos primeiros hits que encontrei tem um parágrafo contendo a frase "... aqui cada nó tem uma interface em cada rede de cluster, existem N * (N - 1) pulsações unicast enviadas por rede a cada 1.2 segundos ...", o que soa como o tipo de coisas que você está procurando - embora descrevendo o Windows Server 2003.
E, claro, se você quiser ver mais dos níveis baixos, configure-o e jogue um sniffer nele.