faltando arquivos após a remontagem do RAID-5

1

Eu tive que abrir a caixa do meu servidor de arquivos hoje para substituir um ventilador defeituoso. O que eu não vi foi que um dos cabos sata não estava conectado corretamente. A primeira coisa que fiz depois de uma reinicialização foi uma verificação do status do RAID e mostrou imediatamente que uma unidade estava faltando. Até este momento o dispositivo não foi usado (no entanto, ele foi montado, então eu não estou 100% certo de que o sistema não fez nada). Parei o md0 e liguei novamente o cabo:

mdadm --stop /dev/md0
poweroff

Após outra reinicialização, verifiquei a unidade removida:

 mdadm --examine /dev/sdd1
 ...
       Checksum : 3276bc1d - correct
         Events : 315782

         Layout : left-symmetric
     Chunk Size : 32K

      Number   Major   Minor   RaidDevice State
this     0       8       49        0      active sync   /dev/sdd1

   0     0       8       49        0      active sync   /dev/sdd1
   1     1       8       65        1      active sync   /dev/sde1
   2     2       8       33        2      active sync   /dev/sdc1
   3     3       8       17        3      active sync   /dev/sdb1

Fiquei um pouco surpreso por ele ter sido mostrado como ativo (mesmo se antes o mdadm dissesse que esse dispositivo foi removido da matriz) e a soma de verificação estava OK. Eu recriou o RAID com:

mdadm --assemble /dev/md0 --scan

O comando mdadm --detail /dev/md0 mostrou que todas as unidades estavam em execução e o sistema estava no estado "limpo". Montei o dispositivo md0 e depois veio hic-cup. Eu queria trabalhar em um dos últimos arquivos que eu estava usando antes de toda a situação e não estava lá. Em outro lugar eu perdi todos os arquivos do diretório onde eu estava trabalhando. Tanto quanto eu posso ver a maioria dos arquivos que são mais antigos do que alguns dias estão intactos, mas alguns mais recentes estão faltando.

Agora, a grande questão: qual seria o seu conselho? Existe uma maneira de obter esses dados? Pensei em remover a unidade que foi identificada anteriormente por mdadm e reconstruir a matriz com outro HDD.

UPDATE

Comecei a fazer o backup das unidades hoje. Depois de montar o md0 como somente leitura eu corro rsync para outro servidor. Agora coisa curiosa. Eu mudei há uma semana alguns diretórios para outro array. rsyns mostrou as seguintes informações sobre esses diretórios removidos:

file has vanished: "/MD0/Data/_NMR_"
    
por Kris_R 23.06.2013 / 23:28

1 resposta

0

Talvez isso ajude alguém.

Eu não escrevi antes, mas todas as quatro partições tiveram a mesma contagem de eventos

mdadm --examine /dev/sd[a-z]1 | egrep 'Event|/dev/sd''
mdadm: No md superblock detected on /dev/sda1.
         Events : 315786
         Events : 315786
         Events : 315784
         Events : 315786

Ainda assim, após algumas leituras, decidi remover a unidade "com falha" e reajustar meu dispositivo md0.

mdadm --manage --set-faulty /dev/md0 /dev/sdd1
mdadm /dev/md1 --stop
mdadm --assemble /dev/md0 /dev/sd[bce]1 --force 
mdadm --manage /dev/md0 --add /dev/sdd1

Por favor, não me pergunte por que funcionou. A parte importante para mim é que eu recebi de volta todos os arquivos (a tabela de alocação de arquivos mostra o conteúdo adequado dos diretórios. Todos os arquivos ausentes estão lá.

    
por 06.07.2013 / 19:08

Tags