Se ele ainda não estiver cercado automaticamente, presumo que seu mecanismo de esgrima não esteja funcionando perfeitamente.
Suponho que o que se poderia fazer é reinicializar os hosts expirados (um por um ou ambos ao mesmo tempo) e informar que o fence do cluster foi bem-sucedido com a ferramenta fence_ack_manual. Isso não aparece nos seus registros?
A execução dessa ferramenta (no nó que solicitou sua execução, que não é o nó que precisou ser reinicializado) permitirá que o sistema de arquivos GFS e o nó defeituoso sejam recuperados. A recuperação consiste principalmente em o nó ser um membro de cluster apropriado novamente e o diário do sistema de arquivos GFS sendo reproduzido, se necessário, iirc.