mdadm O RAID 5 falhou com 2 unidades durante a reconstrução

4

Eu tenho um array RAID 5 com 3 discos ( sdb sdc sdd )

Durante o último fim de semana, fui alertado de que sdd havia falhado. então substituiu o drive, adicionou de volta ao array e deixou-o reconstruir (1.5TB)

Parou em cerca de 64% com um erro, descobriu que sdb também está falhando.

Eu gravei sdd em uma nova unidade ( ddrescue ) e sdb em uma nova unidade ( ddrescue ).

A cópia de sdb foi bem apenas como 3MB que não foi possível copiar. sdb teve muito mais problemas (Por favor, note que não consegui um drive NOVO, então meus drives de imagens são fisicamente maiores que 1.5TB)

Tentando montar novamente a unidade como antes:

mdadm -A /dev/md0 /dev/sdb /dev/sdc /dev/sdd

Deu um erro:

mdadm: no recogniseable superblock on /dev/sdb

Eu também tentei --force , mesmo resultado

Eu também fiz algumas leituras sobre como recuperar o array, reconstruindo-o completamente, então tentei:

mdadm --verbose --create /dev/md0 --level=5 --raid-devices=3 /dev/sdc missing missing

( sdc é a única unidade que não falhou, eu ia começar a matriz e adicionar as outras 2 unidades)

Isso resultou em:

mdadm: RUN_ARRAY failed: Input/output error

Estou realmente em um lugar ruim ouvir. Eu tenho muitos dados que preciso, cerca de 1,2 TB de material, este é o pior cenário possível!

    
por phil 10.08.2012 / 17:17

3 respostas

6

There is no backup.. This is the problem.

Armazenar dados importantes (em QUALQUER sistema, não importa o quão confiável) sem um backup é realmente o problema!

Não tendo backup, e tendo experimentado um modo de falha para o RAID 5 para o qual não há caminho de recuperação adequado, você é agora o que nossos amigos britânicos chamariam de " Right Royally Rogered " (na verdade eles provavelmente usariam uma linguagem mais colorida).

Você está com duas opções neste momento:

  1. Chorar.
  2. Contate uma empresa de recuperação de dados, explique o que aconteceu e entregue a eles um resgate principesco para tentar um ritual de magia negra para extrair seus dados das garras de seus discos com falhas.

(1 e 2 não são mutuamente exclusivos - Na verdade, quando você vê o preço para (2), você provavelmente fará (1) ...)

Você pode considerar isso como uma experiência de aprendizado e uma lição cara sobre a importância dos backups regulares e dos testes de restauração ...

    
por 10.08.2012 / 17:52
4

Eu só queria atualizar todos sobre a solução.

Resultado final recebi todos os meus dados, exceto 2 arquivos, e aqui está o que eu fiz

  • Instalada a unidade boa e a unidade que falhou durante a reconstrução
  • Mdadm forçado para criar a matriz com 1 unidade ausente e definir o sinalizador para que todos os discos estejam limpos
  • usou o MC (midnight commander) para iniciar a cópia dos arquivos pasta por pasta. Uma vez que o mdadm detectou um erro no array, ele emitiu alguns erros, o mdadm removeu o drive do array, tornando o array incapaz. MC, então, me deu um erro de leitura (Perfeito porque eu não queria que ele continuasse copiando dados corrompidos). Anote o arquivo em que foi pendurado
  • Desmontar a matriz, parar o mdadm e reiniciá-lo novamente com 2 unidades, marcá-las como limpas
  • Ignorou o arquivo em que ficou preso.

De qualquer forma, consegui recuperar todos os dados, exceto dois arquivos. Espero que isso ajude alguém que entra nessa situação. Eu também voltei para um RAID-1. Pelo menos com o RAID-1, se 1 unidade tiver setores defeituosos, ainda poderei recuperar os dados sem precisar usar o mdadm.

PS - Aprendi minha lição e também adicionei backups a outra unidade.

Obrigado a todos.

    
por 30.08.2012 / 00:29
3

Nunca use o RAID 5 em discos lentos e nunca o use em raid de software. Também nunca use a menos que você tenha uma placa de invasão decente com seu próprio cache e análise pré-falha.

    
por 10.08.2012 / 17:55