O GlusterFS é ótimo para isso, assim como o Ceph. O GlusterFS é mais fácil de gerenciar e não usa a replicação de nó a nó como um método primário de replicação ou distribuição de dados. Ele pode executar o espelhamento de blocos 2n ou 3n, em que um bloco é meramente um sistema de arquivos em um nó. Uma matriz completa de bricks é referenciada a um volume e um volume é montado como um compartilhamento NFS - com a exceção de que isso é gravação e leitura para vários nós, em vez de apenas um.
O Gluster se expande e sai lindamente, e não tem noção de um nó mestre. Todos os nós participam igualmente nos volumes dos quais são membros. São os clientes que se conectam ao GlusterFS que são responsáveis por distribuir os dados para todos os nós, em vez de cada nó responsável pela replicação dos dados. Dessa forma, você não precisa ter links de backhaul enormes e mal dimensionados.
O seguinte é um bom guia passo-a-passo sobre como configurá-lo: link
Também vale a pena ler a documentação do gluster: link