Nós implantamos o hadoop. Você pode especificar números de replicação para arquivos. Quantas vezes um arquivo é replicado. O Hadoop possui um único ponto de falha no namenode. Se você estiver preocupado com a saída de discos, aumente a replicação para 3 ou mais.
Então, se um disco vai mal, é muito simples. Jogue fora e reformate. O Hadoop se ajustará automaticamente. Na verdade, assim que um disco for lançado, ele começará a reequilibrar os arquivos para manter os números de replicação.
Não sei por que você tem uma recompensa tão grande. Você disse que não se importa em recuperar dados. O Hadoop possui apenas um único ponto de falha no nó de nome. Todos os outros nós são dispensáveis.