Recover a partir de uma falha no disco RAID 5 do software

1

Estou montando uma caixa NAS barata e li alguns artigos sobre o raid5 não ser tão robusto quanto eu imaginava. Eu queria obter algumas respostas para as seguintes perguntas antes de prosseguir. Eu estou propondo a seguinte configuração: 1 disco para o sistema operacional, 3 discos para a matriz, ataque de software Linux para gerenciar a matriz como RAID 5, LVM no topo para esculpir partições, alguma forma de criptografia em algumas partições (provavelmente encfs porque Eu estou acostumado com isso).

Com três discos gerenciados como invasão 5 no Linux, se houver uma falha catastrófica de um dos discos e também um erro de leitura irrecuperável em outro disco, é possível recuperar todos os dados no array além do bloco com o erro de leitura irrecuperável? Posso ler de um array de raid com um disco removido?

Se houver um setor defeituoso em um dos discos, posso determinar em qual disco esse setor inválido está e recuperar os dados dos outros dois discos?

Se eu criptografar todo o array de raid, isso muda as respostas para o acima? Meu entendimento de criptografia é ruim, mas achei que qualquer erro em dados criptografados teria efeitos negativos sobre o restante dos dados. Eu imagino que isso dependeria da criptografia sendo usada.

    
por Dom 21.10.2013 / 20:39

1 resposta

2

A resposta curta é sim, depende e sim. Depende E, finalmente, você está correto, isso depende.

Eu não sei onde você lê o RAID5 não é robusto. É mais robusto do que usar um sistema de 1 unidade; especialmente para o ponto de preço. Se você pudesse pagar por um RAID10 (RAID1 + 0), então provavelmente é tão bom quanto conseguir, a menos que você invista em alguma configuração ridícula mais cara do que você pode pagar. Então, novamente, você poderia ser um bilionário e pode pagar o que quiser. Vendo como você está optando por SOFTWARE RAID sobre HARDWARE RAID, estou inclinado para não. Existem argumentos para ambos os lados, mas se você puder, use RAID de hardware.

O RAID5 é ótimo para redundância e confiabilidade. Ele usa striping de nível de bloco e paridade em todas as unidades, portanto, em um RAID5 de 3 unidades, o maior dano que o subsistema pode sofrer é uma unidade com falha. Se houver erros de leitura no disco, isso depende do tipo de erro de leitura. Se for um bloco ruim, ou seja, um disco defeituoso, então, sim, você ainda poderá ler os dados, desde que seja apenas uma unidade funcionando. Se duas unidades estiverem funcionando, você pode ter sorte, mas é melhor substituir a unidade suspeita o mais rápido possível.

Se houver um setor defeituoso em um disco, você poderá executar utilitários de verificação de disco normais, como uma unidade comum, mas consertar setores defeituosos é complicado sem causar problemas para a configuração RAID5. Geralmente, retirar a unidade e deixar a auto-reconstrução resolverá a maioria dos seus problemas. Se isso não acontecer, você precisará substituir a unidade.

Nota: Você está se preocupando muito com setores em falha e partes ruins. A menos que você esteja usando um lote defeituoso de unidades de disco rígido IDE antigas que precisa manter literalmente no gelo para impedir que elas batam, sua probabilidade de se deparar com esses problemas é mais paranóia do que anomalia estatística.

Independentemente da criptografia, a reconstrução da unidade não será um problema. O sistema verá o subsistema RAID5 criptografado como o subsistema RAID5 regular, porque são os dados criptografados, não a configuração RAID5. No entanto, se você usar o RAID de software e criptografar a unidade do SO e a unidade do sistema operacional falhar, ocorrerá um problema.

Por fim, sugiro que você leia mais sobre RAIDs para entender melhor: Artigo da Wikipédia

Nota: o RAID5 tem suas limitações e outros níveis de RAID são melhores para outras circunstâncias.

    
por 21.10.2013 / 21:01