Como o RAID5 funciona? [duplicado]

6

Em uma configuração de raid 5, você obtém 4 TB de espaço utilizável em discos de 3 x 2 TB. Como isso é possível?

Simples como eu, acho que você precisa de 4 TB para armazenar suas coisas e usar os 2 TB restantes para recuperação. Mas como posso recuperar 4 TB de apenas 2 TB? Se 1kb acabou, eu só tenho 0.5kb para recuperar. E se isso for suficiente, por que não usar 0,5 kb para armazenamento desde o início.

Eu sei que esta é uma pergunta ingênua. Mas qual é a resposta?

    
por exolab 15.11.2010 / 08:31

3 respostas

12

Para o exemplo, temos 3 discos. Um disco contém as informações paridade , os outros dois os dados (assim você perde 1 disco valido espaço para paridade). Agora, para cada bit a paridade é calculada, de modo que todos os discos contenham sempre um número par de bits na mesma posição. (Este exemplo é a teoria básica, a implementação pode diferir ligeiramente):

   Data 1   Data 2      Parity
      0        0             0
      0        1             1
      1        0             1
      1        1             0

Se você perder um disco e tiver agora (para essa posição em todos os discos) as informações 1?1 você sabe, que ? deve ser 0 porque você precisa obter um número par de bits. O mesmo para por exemplo ?00 (== 000 ) ou qualquer outra combinação, também com mais partes de dados (funciona da mesma forma também para 20 dados e 1 discos de paridade). Além disso, desde que você perca apenas um disco (um bit por grupo de paridade), tudo bem.

Nota: A posição da paridade gira (com RAID-5) sobre os discos para cada stripe (bloco RAID, algo entre 2k e 64k bytes), para espalhar a carga nos discos uniformemente.

    
por 15.11.2010 / 08:54
2

Com o RAID 5, a regra básica é que você perde o equivalente a uma unidade fora do seu conjunto para paridade. Isso também significa que você pode perder no máximo uma unidade do seu conjunto de RAID antes que a recuperação seja impossível.

Portanto, com três unidades (o mínimo para o RAID 5), você teria 3TB no total, mas 2TB utilizável. À medida que você aumenta o número de unidades, suas chances de falha aumentam, porque você só pode perder uma unidade do conjunto inteiro.

Assim, seus arquivos são salvos assim:

Drive 1: Striped Data
Drive 2: Striped Data
Drive 3: Parity

Os bits de paridade são distribuídos aleatoriamente pelos discos, portanto, de um byte para outro, você não sabe especificamente em qual unidade seu arquivo está, e qual é a paridade.

Isso ajuda?

    
por 15.11.2010 / 08:36
0

O kicker é realmente o seguinte: você pode obter 99 TB de discos de 100x1TB, perdendo apenas 1%.

No entanto, com 100 discos físicos, a chance de dois discos falharem (quase) ao mesmo tempo começa a se tornar bastante desconfortável.

    
por 22.05.2011 / 02:49