mdadm Raid 1 a matriz do SO desapareceu, todos os zeros do UUID

1

Um pouco da história, porque não tenho certeza do que é relevante ...

Eu configurei um servidor de arquivos em uma escola aqui na África Ocidental onde eles ensinam aulas de informática, ESL e algumas outras coisas. Embora seja usado intensamente todos os dias, o servidor não é gerenciado ativamente por ninguém há vários anos. Tenho certeza que era o CentOS 6.X (provavelmente 0). O sistema de disco é composto por cinco unidades WD Black 2TB. As partições são as seguintes:

1) partição de inicialização, mdadm RAID 1, dois discos ativos, três peças de reposição 2) swap, RAID 1, dois discos ativos, três spares 3) / partição, RAID 1, dois discos ativos, três peças 4-8) várias partições para armazenamento de FS, todos RAID 5, quatro discos ativos, um LVM de reserva de reposição no topo

A escola tem um poder muito instável e, até recentemente, as unidades montadas em rack da APC estavam fazendo um ótimo trabalho. No entanto, as baterias foram substituídas recentemente por outras (o que está disponível aqui) e agora são instáveis. A bateria CMOS no servidor MB (3210SHLX) também morreu.

Também ou por causa da instabilidade de energia, um dos cinco negros morreu. Não se preocupe. Eu troquei o sobressalente da prateleira e comecei a fdisk'ing e ler as novas partições para as várias matrizes RAID. A reconstrução correu bem e essa configuração funcionou bem por alguns dias.

Quando fui chamado de volta uma semana depois, a caixa não inicializava. Nesse ponto, encontrei a bateria CMOS inoperante e percebi que o BIOS usa como padrão o IDE, em vez do modo AHCI, que expõe apenas algumas das unidades, fazendo com que as matrizes RAID tentem se degradar e não o façam.

Usando o systemrescueCD, recebi as matrizes reunidas e ressincronizadas - todas, exceto o / device. Um mdadm -E de qualquer uma das partições membro (sd [abcde] 2) mostrou duas coisas interessantes: o UUID de todos eles é apenas zeros e, no final da listagem, todos eles se mostram como membros da matriz. , mas mostre todos os cinco discos como peças de reposição.

Então, eu tentei reagrupar o array na esperança de que ele fosse reiniciado, mas (eu estou assumindo desde que o UUID está zerado) ele não conseguiu remontar.

Com base no conselho de outra página que encontrei em algum lugar, tentei criar o array RAID 1 usando apenas o sde2 e o outro disco faltando, depois tentei montar esse dispositivo. Fazer isso produz um erro de montagem do NTFS (apesar de a partição subjacente ser obviamente ext (3?). Achei que poderia ter sido um acaso, já que sde era o disco em que eu tinha trocado recentemente, e pensei que se tivesse sido sempre um Sobressai, talvez os dados nunca tenham sido sincronizados com ele. Eu tentei o mesmo com o sdd e depois o sdc, os mesmos erros.

Nesse momento, decidi parar - provavelmente deveria ter feito isso antes. Então, agora eu tenho duas partições que eu não toquei, sda2 e sdb2, e espero que um desses dois seja um dos membros ativos da matriz antes de ser desfeito (ainda não sei como essa parte aconteceu. )

É a partição do sistema operacional, e eu ficaria satisfeito em apenas fazer uma nova instalação, exceto que eu sou um idiota e não fiz backup de meus arquivos conf ou do arquivo secrets.tdb do samba - e é o controlador de domínio para 40 clientes. Então, reinstalar e perder isso exigirá a reconstrução das imagens dessas máquinas e a junção do novo domínio. Eu prefiro não se eu puder contornar isso.

Todas as outras partições agora estão funcionando bem em resgate, totalmente sincronizadas com peças de reposição e funcionando muito bem.

Eu estou esperando por alguns conselhos sobre o que tentar em seguida, esperançosamente, recuperar a partição / das duas partições virgens, uma das quais, esperançosamente, contém uma cópia dos dados da matriz. Mesmo uma cópia antiga seria muito bem.

Obrigado antecipadamente!

    
por JasonPAtkins 20.10.2016 / 11:17

0 respostas

Tags