Devo usar “Raid 5 + spare” ou “Raid 6”?

9

O que é "Raid 5 + Spare" (trecho de Manual do usuário, seção 4.17.2, P.54 ):

RAID5 + Spare: RAID 5 + Spare é uma matriz RAID 5 na qual um disco é usado como sobressalente para recriar o sistema assim que um disco falhar (Fig. 79). Pelo menos quatro discos são necessários. Se um disco físico falhar, os dados permanece disponível porque é lido a partir dos blocos de paridade. Dados de um disco com falha é recriado no disco hot spare. Quando uma falha disco é substituído, a substituição se torna o novo hot spare. Não dados são perdidos no caso de uma falha de disco único, mas se um segundo disco falha antes que o sistema possa reconstruir os dados para o hot spare, todos os dados a matriz será perdida.

O que é "Raid 6" (trecho de Manual do usuário, seção 4.17.2, P.54 ):

RAID6: no RAID 6, os dados são distribuídos em todos os discos (mínimo de quatro) e dois blocos de paridade para cada bloco de dados (peq na Fig. 80) é escrito na mesma faixa. Se um disco físico falhar, os dados de o disco com falha pode ser recriado em um disco de substituição. Este Raid O modo pode suportar até duas falhas de disco sem perda de dados. RAID 6 fornece reconstrução mais rápida de dados de um disco com falha.

Ambos "Raid 5 + spare" e "Raid 6" são tão semelhantes ... não sei dizer a diferença.

Quando "Raid 5 + Spare" seria ideal?

E quando "Raid 6" seria ótimo "?

O manual simplifica o ataque diferente com classificações de 5 estrelas. "Raid 5 + Spare" recebe apenas 4 estrelas, mas "Raid 6" recebe 5 estrelas. Se eu confiasse cegamente no manual, concluiria que "Raid 6" é sempre melhor. O "Raid 6" é sempre melhor

    
por Trevor Boyd Smith 19.11.2010 / 23:24

7 respostas

13

Resumindo:

  • Se a segurança é a sua principal preocupação, vá com o RAID6, já que ele pode sobreviver a duas unidades que falham ao mesmo tempo. Se uma unidade falhar em um arranjo reserva R5 + você não estará seguro de outra falha até que a peça sobressalente tenha sido ajustada para a velocidade que pode levar algum tempo com unidades grandes (e não é inédito para uma unidade que tenha sido desligada para idades, como o seu sobressalente, para deixar de girar quando finalmente chamado).

  • Se o desempenho for superior, vá com 5 + reserva, pois o desempenho de gravação será melhor quando a matriz não estiver em um estado degradado - embora a diferença de desempenho entre R5 e R6 seja significativamente menor que a diferença entre R5 e R5. outras soluções se você tiver um bom controlador (ou seja, uma vez que faça uma operação de escrita em bloco parcial "duas / três leituras simultâneas então paridade calc então duas / três escritas concorrentes" na maioria das vezes em vez de "ler then-read (-then-read) -en-parity-calc-then-write-then-write (-then-write) "que é o que alguns controladores e software RAID muito baratos podem fazer.

Edit: Eu perdi um ponto potencialmente importante na primeira vez:

  • Se o consumo de energia for uma preocupação, o sobressalente R5 + terá uma vantagem extra se seu controlador manter a unidade sobressalente desligada até que seja necessária.
por 20.11.2010 / 00:45
7

RAID 5 + hot spare:

  • no hardware igual controlador melhor desempenho do que o RAID 6
  • você não pode perder 2 discos ao mesmo tempo . quando você perder um disco, haverá um tempo de reconstrução (com o hot spare) no qual você terá sem redundância . Qualquer coisa que falhe neste tempo cria uma perda completa (menos de enviar tudo para uma empresa de recuperação de dados e pagar realmente)

RAID 6:

  • pior desempenho do que o RAID 5 (dependendo do controlador, pode variar de muito perceptível a praticamente nenhuma diferença)
  • você pode perder dois discos ao mesmo tempo

Para qualquer RAID 5 ou 6, você deve ter cuidado ao usar discos que não sejam da mesma produção. Pode acontecer (já vi!) Que depois de uma única falha na reconstrução, o (s) disco (s) seguinte (s) falham devido ao aumento de tensão. Discos da mesma execução têm exatamente o mesmo firmware e provavelmente muito propriedades físicas semelhantes.

Editar: o que escolher

(Isso também depende dos requisitos de desempenho do servidor e do risco tolerável).

Se o ambiente dos servidores for muito bom para hardware (colo, climatizado, etc.), você ficará bem com o hot spare RAID5 +.

Se o ambiente tornar mais provável que mais de um disco falhe em pouco tempo (vibrações, umidade, sujeira), vá para o RAID 6.

Sempre também tenha um backup adequado e teste a recuperação.

Editar 2: Os controladores RAID decentes têm o scrubbing , que verifica periodicamente todos os setores.

    
por 20.11.2010 / 00:28
3

O RAID5 usa uma faixa de paridade. É necessário calcular a correção de erros Reed Solomon e escrever duas faixas para RAID6 e uma para RAID5. O RAID5 é usado para aplicativos de banco de dados intensos, onde o armazenamento é enorme devido ao custo do RAID10. O custo RAID5 varia de 67% a 94% de disponibilidade de disco onde RAID10 é 50% (custos de armazenamento muito mais altos) Embora o RAID6 tenha uma latência de leitura menor devido à latência rotacional, o RAID6 está entre 25 e 31% mais lento nas gravações o cálculo da correção de erros e a gravação adicional do bit de paridade.

Usando o tempo médio entre falhas (MTBF) para as unidades, a probabilidade de duas unidades falharem uma após a outra ou ao mesmo tempo é de cerca de (0.1% x 0.1%)*12 ou 0.001 x 0.001 * 12 ; Se você tiver 1000 unidades em funcionamento, perderá em média ~ 1,2 unidades por ano. Duas unidades falharão uma após a outra a cada 8,3 anos. Agora, como a falha do drive não é uma distribuição de Poisson devido às cargas pesadas no drive durante a reconstrução, é mais provável que ocorra uma falha de um segundo drive durante esse período, e a distribuição está mais próxima de uma distribuição Gamma com valores levemente mais altos após um falha ocorre.

O resultado é que o desempenho do RAID5 é superior ao RAID6 em gravações e para o aplicativo DB - muito melhor. Para uma aplicação principalmente de leitura, como um servidor web, não faz diferença e você deve usar o RAID6. Os benefícios de custo de usar o RAID5 sobre o RAID10 são enormes para armazenamento grande. Se você puder arcar com a sobrecarga, use o RAID10 para aplicativos com alto uso de disco. O RAID10 sempre funcionará melhor.

A maior linha inferior perdida é que o RAID NÃO é backup, mas uma maneira de limitar o tempo de inatividade fornecendo redundância. Se os dados forem críticos, você deve fazer o backup (e testar seu processo de recuperação).

Se uma matriz RAID de 10 drives SAS de 2 TB falhar, a recuperação custará milhares de dólares e levará semanas para se recuperar, se é que isso pode ser feito.

Todos os arrays RAID eventualmente falham!

    
por 27.09.2014 / 06:30
1

Falando estritamente do ponto de vista da integridade dos dados, sim. Você pode perder com segurança quaisquer duas unidades, embora seja uma ocorrência rara perder duas juntas, além de um trauma físico grave no sistema.

Financeiramente, não tanto assim. O hot spare pode ser desligado até que seja necessário, o que significa que ele não usa energia e não apresenta desgaste.

E, como sempre, o RAID não substitui um plano de backup externo adequado.

    
por 19.11.2010 / 23:28
1

Você já considerou 10? Se você tem discos suficientes para o ataque 6, você tem o suficiente para fazer um volume de 10. Na maioria dos casos, 10 é mais rápido e mais redundante (ao custo de algum espaço em disco).

    
por 19.11.2010 / 23:33
1

Essas respostas parecem incorretas porque são baseadas apenas no desempenho teórico da unidade. Considere, se você tiver um controlador RAID com 1 GB de cache, então a gravação (geralmente sob carga normal - não um cenário de alta carga não normal) é imediata do ponto de vista do usuário ou do aplicativo - ele foi para a memória e depois para o a escrita 'real' ocorre no desempenho da unidade.

No entanto, a leitura não pode ser "falsificada" (acelerada com um cache), a menos que os mesmos dados tenham sido carregados recentemente ou habitualmente. Raid 6 é melhor para leitura e é mais tolerante (2 versus 1 drive). Raid 5 é mais lento e muito lento na reconstrução.

Portanto, embora o RAID 5 seja lento na escrita real, ele ficará oculto com um bom controlador RAID - onde a gravação ocorre na memória a partir da perspectiva do usuário / aplicativo. No entanto, Raid 5 é uma leitura mais lenta do que a raid 6 e isso não será melhorado com um controlador a menos que os dados já tenham sido carregados ou um algoritmo mantenha um registro de leituras repetidas. Na vida real - o ataque 6 ganha.

Em conclusão, escrever Raid 5 é lento, mas escondido com um bom controlador e que faz raid 5 ou 6 basicamente o mesmo com o desempenho "percebido" por escrito (há algumas exceções). No entanto, o Raid 6 lê mais rápido e os controladores provavelmente não ajudarão em uma carga de trabalho real para melhorar o desempenho de leitura. Agora adicione que Raid 6 pode levar dois fracassos e Raid 5 + 1 somente um, fica fácil escolher o Raid 6 como uma opção melhor: não se esqueça que a reconstrução no Raid 5 também é muito lenta. Eu também aprendi que as unidades Raid 6 são usadas (assim testadas corretamente) e as unidades que falham tendem a falhar muito rapidamente. Uma vez que uma matriz está ativa por mais de 30 dias, ela tende a durar anos. Um hot spare não foi testado e pode realmente falhar imediatamente quando necessário.

    
por 20.05.2011 / 11:22
0

Estes são os fatos do caso, e eles são indiscutíveis (por qualquer um que saiba do que está falando):

  1. O RAID5 + hotspare é, literalmente, a pior escolha possível de RAID que você pode escolher.
  2. O RAID10 deve ser a escolha padrão se você se preocupa com seus dados (o que significa que você depende disso, por exemplo, para manter seu negócio funcionando).

Se você considerar todas as possíveis opções de RAID, não há casos em que o RAID5 + hotspare seja a melhor escolha, principalmente porque se você tiver o RAID5 + hotspare, isso significa que você tem 4 unidades e com 4 unidades você pode fazer RAID6 , ou melhor ainda, você pode fazer o RAID10.

Com 4 unidades, você obtém o mesmo armazenamento utilizável dentre todas as opções (R5 + HS, R6, R10).

Se o seu objetivo for o desempenho, o RAID10 será superior ao RAID5 e ao RAID6.

Se o seu objetivo for a segurança, o RAID6 ou o RAID10 são superiores ao RAID5 com ou sem um hotspare. É discutível qual deles é mais seguro (6 vs 10). O RAID6 pode sustentar duas falhas de unidade, mas devido a erros de leitura irrecuperáveis (URE's), também é possível que uma única falha de unidade em um RAID6 mate toda a matriz.

O RAID10, porque não é baseado em paridade, não tem o mesmo problema com os UREs. Se uma paridade RAID (R5, etc) perder uma unidade e, em seguida, encontrar um URE, a matriz inteira será perdida. Com RAID1 ou RAID10, se uma unidade for perdida e, em seguida, for encontrado um URE no disco espelhado, somente o setor ilegível será perdido.

Veja aqui para uma explicação detalhada do motivo pelo qual o RAID5 é a pior escolha possível . Veja também aqui para uma lista de opções razoáveis de RAID por número de drives . Observe que em nenhum caso o RAID5 é a melhor escolha (independentemente do hotspare).

    
por 24.09.2013 / 00:05