BTRFS, RAID5 ou RAID6 para armazenamento de dados?

3

Eu preciso configurar um armazenamento para o meu servidor. O hardware é um gabinete de 5 baias e 5 WD RED 8TB.

Eu li a probabilidade estatística de uma falha catastrófica na reconstrução RAID5 (= RAID normal) após falha completa de uma HD, caso haja um evento de URE.

Esta calculadora de acordo com as especificações WD, dá apenas 4,1% de chance de uma reconstrução bem-sucedida em caso de falha de um disco. Eu sei que há especulações sobre esse tipo de cálculo, mas ainda há algumas dúvidas em mente:

  • No RAID5 "normal" (digamos mdadm raid5) se houver um URE durante a reconstrução, isso significa que a reconstrução será cancelada sem outra possibilidade ou a reconstrução continuará, deixando "apenas" o dados afetados (através de listras) para ser inconsistente?

  • O BTRFS com seu mecanismo de registro no diário diminuirá essa probabilidade?

Meu armazenamento armazenará vídeos e fotos. É claro que uma falha na unidade deve ser tolerada, mas posso aceitar isso. Uma reconstrução bem-sucedida pode entregar alguns arquivos corrompidos, mas não pode parar apenas para um único evento de URE.

    
por Menion 24.01.2018 / 16:24

1 resposta

0

O RAID não protege os dados, apenas reduz potencialmente o tempo de inatividade no caso de uma falha de unidade única.

Em primeiro lugar, o RAID não substitui os backups. Se você não tiver um sistema de backup instalado, nenhum sistema RAID impedirá a perda de dados no caso de uma falha de reconstrução.

O RAID permite a recuperação potencial de falhas de hardware. O sistema de registro no diário do BTRFS permite a recuperação de erros do sistema de arquivos. Eles não influenciam uns aos outros.

O RAID 6 é mais caro que o RAID 5 e, potencialmente, permite a recuperação de duas falhas de disco.

A resposta do que o RAID (se houver) usar é determinado pelo propósito do array.

Para o sistema operacional, a meta é a operação continuada e o requisito de tamanho é normalmente relativamente pequeno. Duas unidades em uma configuração espelhada (RAID 0) são muito boas para isso. O custo do RAID 0 é alto. Basicamente, é uma metade das unidades na matriz. Em seguida, mantendo seus dados separados, o RAID 5 ou 6 são os mais eficientes economicamente. O "custo" é um disco para RAID 5 ou dois discos para RAID 6. Então, basicamente, você pode reduzir o tamanho total de sua capacidade de armazenamento de dados em um disco ou dois?

Agora, voltemos ao propósito do RAID. O RAID protege a disponibilidade do que estiver armazenado no array. Os backups protegem a integridade e a disponibilidade. O RAID protege contra o mau desempenho de uma unidade (ou duas com o RAID 6 ou mais, com esquemas de armazenamento mais sofisticados).

O objetivo dos backups é proteger os dados. Os backups fornecem recuperação de desastre de qualquer lista de possíveis desastres. Em qualquer lugar que você me veja, use a palavra backups, quero dizer, backups BOM VERIFICADOS criados usando um sistema que você projeta para fornecer uma frequência de backups que satisfaça suas necessidades, em uma rotação que garanta a recuperação de erros "Opa" (Hey sysadmin, Eu apaguei este arquivo acidentalmente 30 dias atrás), e com uma cópia armazenada fora do local para que seus dados estejam protegidos contra desastres do tipo destruição do sistema. E sua rotina de backup deve incluir a restauração de um arquivo aleatório após cada backup para confirmar que o backup é legível.

Como o espaço em disco não é infinito, e os backups podem ficar caros, e estamos falando no nível de superusuário aqui, suponha que você tenha que fazer um monte de compensações. Pessoalmente, eu faço backups duplicados anualmente de uma unidade externa que armazena as coisas que eu não quero perder. Eu tenho terabytes de lixo que eu só guardo para a conveniência de não ter que baixá-lo novamente. As coisas que guardo são copiadas para uma unidade externa automaticamente em uma base semanal. Essa unidade é copiada duas vezes por ano. As duas cópias são armazenadas fora do local. Uma cópia em um cofre local. O outro na casa de um membro da família.

Então, resposta curta. Backups para proteger seus dados. RAID 6 para proteger a disponibilidade do seu sistema.

Editar: Outra maneira de ver isso é que a recuperação de RAID é realizada em nível de bloco contra setores de disco. As ferramentas de recuperação de registro no diário do sistema de arquivos estão no nível do arquivo.

    
por 24.01.2018 / 19:14