Debian / 3ware 9500 - Falha de RAID?

0

Troquei os discos rígidos do meu servidor doméstico para um novo gabinete na noite passada (novo mobo / CPU / RAM) e transferi sua placa RAID SATA 312 9500 PCI-X SATA com ele. A máquina possui 4 discos configurados em 2 RAID1s - root (500GB) e media (1TB). Ele roda o Debian 7 de 32 bits.
A máquina inicializou bem, mas apenas quando estava em execução e os utilitários 3ware foram carregados, notei que um dos discos raiz estava faltando na matriz. Eu desliguei e balancei os discos ao redor (eu sei que este disco é temperamental, eu preciso comprar um novo) e, eventualmente, tenho a placa RAID para vê-lo. Isso significava iniciar uma reconstrução RAID, então deixei a máquina reinicializar no Debian para que eu pudesse ficar de olho no seu progresso e deixar a reconstrução começar.
Ele correu bem na faixa de 90% antes de eu ter que fazer outra coisa. Quando voltei, desastre - a placa RAID não mostrava RAIDs ou discos presentes. O Debian ainda estava rodando (de alguma forma!) Mas eu não pude fazer nada. O volume de mídia tinha acabado e o FS raiz parecia estar completamente corrompido - o bash estava interpretando os binários do sistema como sequências aleatórias de números. Não havia mais nada a fazer além de reinicializar (e isso tinha que ser uma reinicialização difícil, o comando de desligamento não funcionava). A placa RAID detalhou todos os 4 discos presentes, mas o disco com problema ainda estava em uso, significando que uma reconstrução RAID manual ainda era necessária. Quando o Grub apareceu, ele declarou que não podia reconhecer os sistemas de arquivos em nenhum dos meus RAIDs, então me deu o shell de recuperação - não tenho idéia de como usar isso (minha internet também caiu), então não faço ideia em que estado meus discos estão. Eu removi o bom disco raiz e tentei trazer o sistema para cima em modo degradado no disco temperamental para ver se havia algum dado utilizável nele, mas a placa RAID se recusou a permitir que eu o usasse como meio de inicialização.
Se necessário eu tenho um adaptador USB-SATA, mas estou pensando neste estágio quais são minhas chances de recuperar o sistema; Eu sei que o RAID não substitui o backup, mas há muitos dados sobre esses discos que me levarão muito tempo para serem reconstruídos (isto é, eles não são insubstituíveis, mas eu não quero limpar o sistema e começar do zero) . Alguma idéia de onde eu poderia começar?

Editar: fez algum progresso. Parece que o disco 'bom' do par de raízes sofreu uma falha de hardware no meio da reconstrução! Eu tentei dd-lo para um novo disco e tenho erros de IO, e SpinRite não quer tocá-lo. O disco 'ruim' está em algum tipo de limbo, mas uma das partições lá passou no fsck e monta em um disco ao vivo, então estou gravando para um disco reserva. Isso não explica por que os outros dois discos de mídia desapareceram, mas recuperar a partição / home é um ótimo começo.

Editar 2: algo muito estranho está acontecendo aqui. Os dois discos de mídia não aparecem na BIOS da minha área de trabalho e, via USB, no meu laptop, eles aparecem sem nenhuma tabela de partição. Estou começando a me perguntar se, de alguma forma, três desses quatro discos morreram de uma só vez, ou se foram mortos pelo novo hardware - se é assim, não posso descobrir por que, uma oscilação de energia é a única coisa que posso pensar de mas isso deveria ter brindado a mobo primeiro!

Editar 3: além do meu último comentário, o problema dos discos não detectados é aparentemente devido à maneira como o cartão 3ware os usa; os discos de mídia aparecem bem com o controlador 3ware, com suas tabelas de partição intactas. fsck'ing-los agora, dedos cruzados eu posso chegar aos dados ...

Editar 4: Consegui recuperar tudo dos discos de mídia, embora precise executar um fsck extenso na partição antes de montá-lo. Houve muitos erros com inodes incompatíveis ou inválidos e contagens de espaço livre. O estranho é que nada deveria realmente estar usando os discos no momento. OK, o Plex Media Server estava funcionando, mas como eu não havia tocado nenhuma mídia na unidade, não acho que isso poderia ter atrapalhado o estado do sistema de arquivos quando os RAIDs caíram. Vou tentar entrar no disco raiz válido, ver o que os logs dizem. Até eu determinar o que fez com que os RAIDs simplesmente desaparecessem, voltarei ao software RAID.

    
por Gargravarr 01.11.2013 / 13:52

1 resposta

0

Meus dados ainda estavam nos discos. Não tenho ideia do que os destruiu, mas agora desconfio dos controladores de hardware. Eu reconstruí a máquina usando o software RAID e coloquei todos os dados recuperados de volta no lugar. Não sei por onde começar se alguém tiver esse problema.

    
por 08.11.2013 / 21:42