Raid 5 com hot spare ou RAID 10 sem hot spare?

5

Sim, é sobre essas perguntas "faça meu trabalho por mim", tenha pena:)

Estou no limite do que posso fazer com o número de discos rígidos em um servidor sem gastar uma quantia substancial de dinheiro. Tenho quatro drives para configurar e posso configurá-los como um RAID 5 e dedicar um hot spare, ou um RAID 10 sem hot spare. O tamanho de cada um será o mesmo e o RAID 5 oferecerá desempenho suficiente.

Sou o RAID 5, mas também não gosto da ideia de correr sem um hot spare. Não estou tão interessado em desempenho degradado, mas na quantidade de tempo que o sistema fica sem redundância adequada. O servidor e as unidades estão em um contrato de resposta de 13x5 4 horas (embora eu saiba que o fornecedor de serviços mais próximo esteja no mínimo 2 a 3 horas de carro no inverno).

Devo observar que o servidor também possui dois arrays RAID 1 que também seriam protegidos pelo hot spare. Por que eles não fazem gaiolas com 9 baias! Heh.

    
por Boden 25.01.2010 / 18:45

7 respostas

4

Qual é a tolerância de tempo de inatividade da matriz? É fisicamente próximo ou em um data center remoto? Bascialmente, se você pode tolerar isso, um cold spare permite que você faça o RAID10. O sobressalente está sentado por perto, mas você tem que fazer a troca fisicamente. Se esse não for um cenário aceitável, o RAID5 com um hot spare é a única resposta que resta.

Como você já tem dois conjuntos RAID1 com tolerância a falhas de 1 unidade, você realmente não ganha nada com RAID10 sem reposição. Toda a sua matriz ainda pode sobreviver apenas a uma falha na unidade.

    
por 25.01.2010 / 18:57
9

Estes ataques são todos relativos uns aos outros, assumindo os mesmos discos e controladores no array.

  • Raid5: Boa velocidade de leitura, velocidade de gravação podre, pode sobreviver a qualquer falha de disco duplo se as falhas ocorrerem durante tempo suficiente para a invasão reconstruir entre falhas. (ou seja, disco falha, reconstrói raid, disco falha, você está bem). Se você tiver falhas simultâneas de disco duplo, você é SOL a menos que uma das falhas seja o hot spare. Com uma matriz de 4 discos, metade das falhas de disco duplo arruinarão o seu dia.

  • Raid6: Boa velocidade de leitura, velocidade de gravação realmente podre. Pode sobreviver a qualquer falha de disco duplo. Não tão comumente implementado quanto os outros ataques.

  • Raid10: Boas velocidades de leitura e gravação, pode sobreviver a qualquer falha de disco, pode sobreviver (no caso de uma invasão de 4 discos) a metade das possíveis falhas de disco duplo.

  • three-way-mirror + hot spare: ocupa menos espaço, pode sobreviver a qualquer falha dupla de disco e falha de até 3 discos se as falhas ocorrerem durante tempo suficiente para o espelho ser reconstruído uma vez. Não tenho certeza de quantos controladores / sistemas operacionais suportam isso, mas foi um recurso que usei no Solaris com o material MD antes do ZFS.

Há alguns problemas para se preocupar quando se olha para isso:

  1. quanto tempo leva para reconstruir uma matriz? A Sun começou a desenvolver o ZFS quando percebeu que, em algumas situações, o tempo para reconstruir uma matriz raid5 é maior do que o MTBF dos discos na matriz, garantindo virtualmente que uma falha no disco resulte em uma falha na matriz.

  2. discos do mesmo lote de fabricação podem ter a mesma falha (ou o palete foi removido ou eles colocaram muita cola nos pratos quando eles estavam fazendo os discos )

  3. Quanto mais complexa a matriz de ataque, mais complexo é o software no controlador / implementação; Eu vi como muitos controladores de raid matam arrays, pois discos com defeito matam arrays. Eu vi discos individuais girar por anos e anos e anos - a maioria faz isso de fato. O sistema mais confiável que já tive foi uma caixa com nada redundante que simplesmente nunca teve uma falha de componente. Já vi muitas UPSs e invasões e redundantes (inserir componentes aleatórios) causarem falhas porque tornaram o sistema mais complexo o suficiente para que a complexidade fosse a origem da falha.

Você paga seu dinheiro, você se arrisca ... A pergunta é,

Você sente sorte ?

    
por 25.01.2010 / 20:10
5

Eu teria que discordar do CHopper3. Como há apenas 4 unidades nessa situação, seus recursos de falha são os mesmos (2 unidades) em qualquer cenário, exceto com o RAID 10, se você perder os dois discos errados, você terá um problema real. Também há definitivamente um benefício adicional de ter um sobressalente global para seus outros RAIDs também.

    
por 25.01.2010 / 19:02
2

Eu acho que depende também do que você quer colocar neste RAID. Em uma situação, meu cliente e eu decidimos optar por dois RAID1. A situação era assim: era um servidor Vmware com 4 VMs nele. Duas dessas VMs foram consideradas muito importantes (= dados valiosos sobre ela e leitura / gravação intensiva) e as outras duas menos importantes. Então colocamos uma VM importante e uma não importante juntas em um RAID1 e as outras duas no outro RAID1. Nossos argumentos em que, no caso de uma falha de 2 discos, ainda há uma chance de que tudo esteja funcionando. O pior é que uma matriz RAID não está funcionando. Então ainda temos duas VMs em execução.

Então, meu caso é que isso depende também do que você deseja colocar nesses discos, talvez o mesmo seja a melhor solução.

Qual sistema operacional está sendo executado no servidor? Se você tem Linux, você poderia fazer dois RAID1 e então combiná-los com LVM também.

Caso contrário, recomendo que você fique com a resposta de Chris.

    
por 25.01.2010 / 21:03
2

Algumas outras coisas precisam ser consideradas também. Qual é o tamanho / rapidez de cada uma das unidades? Unidades SATA de 1TB podem levar uma eternidade e um dia para reconstruir o ponto de comutação em um RAID5, deixando uma grande janela aberta para uma falha no segundo disco.

Você diz que o desempenho não é um problema, mas eu vi alguns hits de desempenho consideráveis ocorrendo durante uma reconstrução do RAID5 (especialmente em gravações).

    
por 25.01.2010 / 23:30
1

R10 toda vez, assim metade dos seus discos podem falhar, com R5 + HS você morre se dois morrerem.

Além disso, o R10 deve ser mais rápido também.

    
por 25.01.2010 / 18:48
1

No RAID 10 com quatro discos, há seis combinações de cenários de falha dupla de disco. Apenas dois dos seis vão matar toda a matriz, então você pode sobreviver a 66% das falhas de disco duplo

    
por 16.08.2012 / 23:59