Você pode querer olhar drbd , que oferece redundância de disco como RAID-1 e compartilhamento pela rede.
Drbd is a block device which is designed to build high availability clusters by providing a virtual shared device which keeps disks in nodes synchronised using TCP/IP. This simulates RAID 1 but avoiding the use of uncommon hardware (shared SCSI buses or Fibre Channel). It is currently limited to fail-over HA clusters.
Se você estiver executando muitos servidores virtualizados em vez de um cluster HPC no estilo beowulf, talvez também queira dar uma olhada no ganeti , ele pode usar o LVM e o DRBD para fornecer VMs de alta disponibilidade que migram automaticamente para outros nós, se e quando necessário.
Ganeti is a virtual server cluster management tool built on top of the Xen and KVM virtualization technologies and other free software. It provides an automated environment to manage highly available virtual machine instances.
It is designed to facilitate cluster management of virtual servers using commodity hardware, and to provide fast and simple recovery after physical failures. It can take care of operations such as redundant disk creation and management, operating system installation (in cooperation with OS-specific install scripts), startup, shutdown, and failover of instances between physical systems.
Eu não usei ganeti na produção, mas experimentei muito com ele alguns anos atrás antes de pegar um trabalho para trabalhar em um cluster de openstack (usando a infraestrutura de openstack para construir e executar clusters HPC virtuais para pesquisadores em universidades de todo o país (Austrália)). Ganeti trabalhou muito bem nos meus testes, eu realmente admirei como foi construído e trabalhado.
Se você procurar, pode até encontrar um módulo complementar que permita usar as exportações iscsi do ZFS em vez do LVM + DRBD para os discos da VM.