Como uma matriz de disco pode usar menos paridade do que dados?

2

Eu tenho visto calculadoras de disco como a mostrada aqui:

link

Eu coloco 16TB (4 + 6 + 6) e ele diz que eu posso ter 10TB de dados e 6TB de proteção. Como se pode dar ao luxo de oferecer isso? Eu acho que depois de striping de 4TB ele deve ser incapaz de proteger os 2TB restantes, porque não há informações suficientes para resolver a paridade

Eu assumo que a paridade é comprimida de alguma forma. Existe uma maneira de provar que uma quantidade máxima de espaço será necessária para a paridade comprimida, ou está mentindo e puxaria um pouco de hijinx como se estivesse fingindo que a unidade está cheia se não conseguiu a taxa de compressão que deseja?

    
por awiebe 15.08.2017 / 07:59

2 respostas

2

Com três unidades de 4, 6 e 6 TB, a Synology configuraria seus dados como:

  • Uma matriz RAID5 de 12 TB usando os primeiros 4 TB de cada disco - 8 TB de dados, 4 TB de paridade.

  • Uma matriz RAID1 de 4 TB no espaço restante nos dois discos de 6 TB, com 2 TB de dados espelhados em cada disco (dados de 2 TB, 2 TB de "paridade").

No total: 10 TB de dados, 6 TB de cópias redundantes. Não é necessária compactação.

    
por 15.08.2017 / 08:25
0

Dependendo de como a matriz está configurada, tudo o que você precisa proteger é uma única falha na unidade, a terceira unidade contém o que é conhecido como informações de "paridade" para as outras duas unidades.

Efetivamente, o que você tem é a seguinte simplificação:

  • Unidade 1: bloco de dados 1
  • Unidade 2: bloco de dados 2
  • Unidade 3: bloco de dados que contém a soma do bloco de dados 1 e do bloco de dados 2

Se o bloco de dados 1 ficar corrompido, você pode simplesmente pegar os dados na unidade 2 e subtraí-los dos dados na unidade 3 para recuperar as informações na unidade 1. Dessa forma, você tem resiliência, mas não precisa tanto espaço como um backup completo e pode ser estendido para qualquer número de drives e fornecer tolerância a falhas para qualquer falha na unidade single .

Isso será mais lento do que apenas ler os dados originais e não protegerá seus dados se você tiver dois drives falharem, mas significa que você só precisa usar uma única unidade para proteção, em vez de precisar de uma unidade de backup para cada unidade de "dados".

Como um exemplo para o RAID 1 (espelho), você sempre terá metade do seu número total de discos "desperdiçados" para fornecer redundância em caso de falha. No tema acima (RAID 5) você pode ter quatro discos e só precisa usar um deles para as informações de paridade, o que significa que em vez de usar metade do seu espaço em disco para proteção você está usando apenas um quarto deixando você três quartos para o seu armazenamento.

    
por 15.08.2017 / 08:27