Atualmente, estou investigando o ceph como uma alternativa ao nosso armazenamento de dados. Eu encontrei sua pergunta e fiz algumas leituras e espero que essa ideia faça sentido. A forma como eles fazem a distribuição dinâmica de dados sugere que, se você tiver um número alto de OSDs (significativamente mais do que o nível de replicação). Então parece que seria possível (e provável) que o algoritmo de distribuição colocasse algumas partes de arquivos em um grande número de OSDs, de modo que se você perdesse N nós (onde N é maior que seu nível de replicação) é altamente provável que você perderia seus dados (ou pelo menos tem uma quantidade significativa de corrupção). O que não é realmente uma surpresa. Eu esperaria ter perda de dados se você perdesse 3 nós em seu cluster (como seu exemplo), a menos que seu nível de replicação fosse 4 ou superior.