Nos últimos meses, acho que descobri o suficiente para responder a essa pergunta.
Primeiro, o Raspberry Pi durou apenas tanto tempo que acabei atualizando para um computador real com ótimas especificações. Eu decidi que só tinha duas opções para o que eu precisava, BTRFS e Ceph .
BTRFS
Esta é a melhor opção para um único nó com vários discos. Atualizar para o Ceph posteriormente para os recursos distribuídos não é muito difícil, e é muito fácil trabalhar com o BTRFS.
Algumas razões são ótimas:
- Proteção automática do bitrot silencioso. Se houver um erro de soma de verificação, ocorrerá um erro.
- Cura automática do bitrot no Raid 1. Ele detectará o erro e substituirá os dados errados pelos dados corretos de outro disco no array do RAID 1.
- Lidar com o BTRFS ao vivo é muito fácil. Os utilitários de linha de comando são ótimos.
- Pode lidar com discos de tamanhos diferentes, mas às vezes resulta em espaço não utilizado.
Ceph
- Pode distribuir entre nós.
- Também tem proteção de bitrot com o BlueStore.
- Pode exigir muito poder de processamento e processamento em comparação a outros. Provavelmente por causa do ótimo conjunto de recursos.
O que eu decidi fazer
Como ainda tenho apenas um único nó, tenho um array BTRFS raid 1 com um SSD de 2 TB e dois SSDs de 1 TB. Isso está funcionando muito bem, e adicionar o SSD de 2 TB mais tarde foi fácil.
Eu planejo mudar para o Ceph quando tiver mais servidores e fizer mais sentido. Mover os dados não deve ser muito difícil então. O único problema é ter armazenamento disponível suficiente para movê-lo de um lugar para outro.