isso é bobagem, isso já aconteceu antes e eu descobri como consertá-lo e tudo bem.
Estou executando 4 unidades SATA de 500 GB em um RAID-5 no servidor Ubuntu 7.10. Um dos discos falhou (na verdade, acho que é um dos conectores da gaiola hot swap) e está sendo executado em três discos enquanto eu encontro um HDD de substituição ou diagnostico ainda mais o problema.
Agora, antes de você ler mais, NÃO, eu não tenho backups e as informações não são super importantes, é bom tê-las.
De qualquer forma, uma vez antes, eu tive algum tipo de soluço de HW, talvez a energia tenha sumido ou algo assim, e eu tive problemas para recuperar a matriz. Não foi que um dos discos falhou, foi outra coisa.
Consegui simplesmente adicionar de volta no segundo disco "com falha" e, em alguns minutos, eu estava de volta à ativa. Talvez eu tenha que executar algum tipo de verificação do sistema de arquivos, não sei.
Passei horas, se não dias, tentando descobrir como fazer isso da última vez e desde então me esqueci.
O ponto crucial do problema é que, se eu executar um mdadm --examine em sdb, sdc e sdd, o sdd acha que ainda faz parte do array, mas nas informações do superblock de sdb e sdc, ele lista o sdd como removido.
sda é o disco que falhou muito antes, está listado corretamente em todos eles como defeituoso removido.
TIA. O servidor em questão não está na internet, por isso não é possível enviar a saída de vários comandos para o fórum.
Eu sei, agora muitos de vocês provavelmente acham que sou um idiota, ou pior. No entanto, lembro-me que uma vez que eu descobri a série de comandos para executar, foi um procedimento bastante simples e funcionou muito bem.