Eu fiz algum progresso sobre isso.
O problema parece estar relacionado à escolha de usar nós ram em vez de disco no arquivo rabbitmq.config. Da documentação:
RAM nodes are an advanced use case; when setting up your first cluster you should simply not use them. You should have enough disc nodes to handle your redundancy requirements, then if necessary add additional RAM nodes for scale.
A cluster containing only RAM nodes is fragile; if the cluster stops you will not be able to start it again and will lose all data. RabbitMQ will prevent the creation of a RAM-node-only cluster in many situations, but it can't absolutely prevent it.
Quando eu altero o arquivo de configuração para usar "disco" em vez de "ram", a criação do cluster ficou muito mais estável.
[{rabbit,
[{cluster_nodes, {['rabbit@rabbit1', 'rabbit@rabbit2', 'rabbit@rabbit3'],disc}}]}].