Em uma matriz de disco RAID 5, a recuperação de uma unidade aumenta a chance de outra unidade falhar?

2

Se você tiver uma matriz RAID 5 básica de 3 ou mais unidades de disco rígido e uma falhar, isso aumentará a chance de uma das outras unidades falharem e impossibilitar a recuperação total? Se cada uma das unidades estiver sendo lida durante o processo de recuperação, isso as tornará mais propensas a falhar, presumindo que elas estejam ativas apenas uma pequena parte do dia?

Se isso afetar a estabilidade durante uma recuperação, posso estar considerando o RAID 6. Além disso, existe algum benefício ou desvantagem de usar o RAID 5 em vez do RAID 4? Parece apenas mais organizado para usar o RAID 4 e mais difundido para usar o RAID 5.

    
por Phoenix Logan 26.01.2014 / 01:52

3 respostas

3

Primeiro, se você estiver definido em uma invasão de paridade, eu recomendaria um RAID 5 com um esquema de backup automático sobre um RAID 6. O backup poderia ser feito em várias unidades (recomendado), um RAID 0 (não recomendado) ou outro RAID 5. Isso traz um bom equilíbrio de custo e segurança para seus dados, pois também pode manipular falhas do controlador e erros humanos.

O que você estará seguro depende do (s) tamanho (s) da sua matriz

Muitos na indústria de TI estão se afastando do RAID 5 por dois motivos. Primeiro, o tamanho de corte de muitos dos arranjos exige tempos de reconstrução extremamente longos, o que abre a janela para uma segunda falha. O segundo é o problema de um URE, que é um erro de leitura irrecuperável, que não é conhecido até que um bloco não seja lido e, então, todo o array nessa unidade se torne ilegível. Novamente, os UREs ocorrem raramente em termos de número de erros por leitura de bits, mas quando você tem matrizes de tamanho de TB, raramente é muito frequente. Uma matriz não pode ser reconstruída a partir de uma unidade com um URE. Então, se você tiver uma falha e um URE, você efetivamente terá duas unidades com falha. O RAID 6 ajuda com isso, porque você pode perder duas unidades e ainda reconstruir a matriz.

Mas, se você tiver uma matriz de 100 GB em um RAID 5, esses problemas diminuirão bastante e um RAID 5 se tornará mais viável; no entanto, se você tiver uma matriz de 100 TB (apenas como exemplo) em uma invasão 6, talvez seja necessário mais redundância ou outra opção!

O RAID 5 com matrizes de TB é definitivamente uma aposta e eu não confiaria nela. E não faz sentido executar um RAID 6 com 4 unidades em um RAID 10, a menos que você esteja expandindo seu array em breve e precise fazer isso 1 unidade de cada vez por um custo. E não podemos esquecer que você pode executar múltiplos arrays RAID 1, apenas separa seus dados em partições / discos separados com os quais você tem que trabalhar e tira a conveniência de uma grande unidade.

Mas tudo tem sua ressalva. Quanto maior o RAID 5, maior a chance (exponencialmente maior) de uma falha de reconstrução devido a uma segunda falha na unidade ou no URE. RAID 6 maior custo e complexidade. RAID 10 custo mais alto ainda (mas por simplicidade). E o custo de conveniência do RAID 1 múltiplo.

No final, você precisa identificar suas necessidades, segregar o que não pode perder e o que você está perdendo. Combine isso com um orçamento e seu nível de conhecimento ao escolher qual array escolher.

Nós, colocamos nossos dados de escritório e domésticos em um RAID 1 (2 drives RAID 10 com MD RAID, na verdade) para segurança com backups diários. é simples, rápido e confiável. Quaisquer outros dados, como arquivos de vídeo ou outros arquivos grandes não críticos, colocados em uma unidade RAID 5 ou unidades individuais com backups ocasionais com base na importância dos dados, porque não queremos oferecer o mesmo nível de segurança com nossos filmes fotos de família e / ou arquivos de nossas empresas.

    
por 01.02.2014 / 08:48
3

O ato de reconstruir a matriz RAID pode levar muito tempo (dias) e ser muito difícil para os discos. Durante este tempo de reconstrução, os discos sobreviventes são mais suscetíveis a falhas devido à sua atividade.

Antes do início da reconstrução, os discos sobreviventes não estão com uma chance elevada de falha.

Por esse motivo, pode ser desaconselhável ter um "hot spare" no sistema, uma vez que ele acionará automaticamente uma reconstrução e causará uma falha. Além disso, encontrar um erro de leitura irrecuperável durante a reconstrução pode causar uma falha de matriz, mesmo que nenhum outro disco tenha falhado. É melhor primeiro copiar os dados do array e depois reconstruí-los, se não houver backups recentes.

    
por 26.01.2014 / 05:51
1

Resposta curta SIM - O RAID 1 + 0 foi projetado ESPECIFICAMENTE devido à probabilidade de falha durante uma reconstrução do RAID5.

Resposta longa - Sim, há uma chance elevada de falha na unidade. No caso "mais óbvio / mais simples", pode-se argumentar que há mais calor sendo gerado, assim, uma chance ligeiramente maior de falha. Dito isto, este não é o risco real.

O risco real é que, se as unidades forem compradas aproximadamente ao mesmo tempo, há uma chance muito grande de que as unidades falharão ao mesmo tempo. Assim, a chance da segunda unidade falhar durante a reconstrução é aumentada. Infelizmente, este cenário não é acadêmico - quanto maior a unidade, maior a reconstrução e maior a chance de falha. O RAID5 é geralmente aceito como sendo de pouco benefício com grandes conjuntos de discos. A solução aceita é o raid 10 (Read as RAID one 1 + 0). Basicamente, isso cria dois conjuntos idênticos de dados em dois conjuntos de matrizes - portanto, usa muito mais (quase o dobro) de espaço que o RAID5, mas oferece proteção muito maior contra falhas multidrivas - que, infelizmente, é comum em unidades de tamanho grande .

    
por 26.01.2014 / 09:24