Talvez um sistema de verificação e visualização também funcione aqui para você também?
Supondo que você tenha algum tipo de servidor HTTP em execução no nó principal, você pode escrever um pequeno script php / perl / whatever que permita marcar quais computadores estão prontos para serem reinicializados.
Em seguida, em cada nó, coloque um trabalho cron que pesquisa o script para ver se está tudo bem reinicializar. Se o nó principal envia de volta o ok, então ele deve reiniciar. Uma vez que o headnode tenha enviado o comando ok-to-reboot, poderá limpar o sinalizador.
Eu configuraria isso usando um diretório com alguns arquivos de texto, se o script visse o nome, então envia de volta o OK para reinicializar, em seguida, apaga o arquivo. Fácil para você gerenciar, porque você só tem que tocá-los para marcar um ok. Seguro porque você não precisa passar nenhuma dessas informações diretamente para o sistema de arquivos.
Cada script nos subnós apenas verifica pelo nome do host ou algo do tipo;
link
Verificar a cada 5 minutos não deve ser muito desgastante.