Recuperando dados de uma configuração RAID 5 com falha

3

Eu tenho um array RAID 5 de quatro discos que está em processo de falha. Um disco está completamente inativo e smartctl está me dizendo que um segundo disco está falhando. Todos os dados no RAID são copiados, no entanto, cerca de 1 TB não é trivial para restaurar uma vez que é ripado CDs e DVDs e eu teria que copiá-los novamente. Eu tenho um disco sobressalente que eu posso trocar para a unidade morta e tentar reconstruir, se esse é o termo certo, o RAID e, em seguida, fazer backup dos dados difíceis para uma nova configuração RAID 6 completamente saudável. Eu também poderia fazer backup dos dados do RAID agora não redundante diretamente para o novo RAID.

É mais suave em um disco de um RAID de quatro discos não redundante para "restaurar" o RAID ou copiar os dados diretamente.

Se for importante, os discos são de 2 TB, cada um com um tamanho total de RAID de 6 TB. Existem cerca de 5 TB de dados no RAID e gostaria de obter 1 TB de dados.

    
por StrongBad 09.04.2014 / 12:32

3 respostas

2

"Reconstruir" um disco recém-adicionado a uma matriz RAID ou acessar um ARRAY degradado são significativamente próximos em termos de tensão nos discos. A diferença aqui é mais sobre o tamanho dos dados para ler: 6 GB contra apenas 1 GB.

Aconselho-o a copiar tudo o que puder enquanto puder nesse disco sobressalente.

O pior cenário é que o disco morrendo antes de você terminar a cópia ou durante a tentativa de reconstrução do RAID.

  1. Ao tentar salvar arquivos: você terminaria com alguns dos seus dados "não triviais" salvos
  2. Ao recriar o array: você perderia tudo

(a escolha é óbvia)

    
por 09.04.2014 / 12:49
2

Copie os dados da matriz primeiro. Reconstruir um conjunto completo de RAID 5 envolverá a leitura de todos os dados de qualquer maneira, pois novos dados de paridade devem ser calculados. Se você copiar apenas os dados necessários, estará colocando menos pressão no disco com falha.

    
por 09.04.2014 / 12:45
1

Se um disco já tiver desaparecido completamente, você não terá mais redundância.

Se outro disco estiver falhando, você poderá duplicar esse disco usando ddrescue e, em seguida, ver o que resta usando a duplicata.

Neste ponto, você tem corrupção de dados silenciosa; com algum esforço você poderia localizar os arquivos afetados, por meio de ter ddrescue registrar quais áreas não puderam ser lidas e usando filefrag para determinar quais arquivos tinham extensões nessas áreas.

Pode ser mais simples copiar os arquivos do array danificado, contanto que ele ainda esteja funcionando. É um pouco perigoso, já que tal cópia de acesso aleatório é mais estressante para um disco do que um ddrescue linear, e se o disco morre completamente, tudo desaparece.

Boa sorte.

PS: Você nunca deve deixar as coisas chegarem tão longe. Teste seus discos regularmente para erros de leitura, substitua os discos ao primeiro sinal de problema. Sem monitoramento, mesmo um RAID6 não vai te ajudar muito, se você deixar os erros de leitura passarem despercebidos por meses ...

    
por 09.04.2014 / 14:36