xfs tabela de partição na matriz RAID corrompida

1

Então, eu geralmente sou bastante experiente, e com o google do meu lado sou capaz de descobrir as coisas. Desta vez, no entanto, estou em uma perda para descobrir o que fazer.

fundo: Eu tenho um servidor que eu construí, usando 14.04LTS do Ubuntu, com um cartão RAID de 2720sgl sas highpoint rocketraid, ligado a 8x1TB drives, configuração como um RAID 5. O Ubuntu está servindo esse array de raid com minha mídia, usando plex e muitos outros aplicativos, dependendo do que eu preciso. a matriz de ataque é antiga. foi inicialmente configurado em 2007, como um 4x1TB, depois cresceu e cresceu e cresceu. no início deste ano, uma unidade morreu. Eu então optei por substituí-lo usando novas unidades digitais ocidentais (azul ... estupidamente, eles estavam à venda). ao crescer, a matriz falhou. Eu tentei quase tudo ... finalmente acabei de sair, comprei 2x4TB, copiei TUDO, e reconstruí a matriz do zero, e movi os arquivos de volta.

o array agora é uma partição massiva de 6.5TB usando o XFS.

Se eu for mover grandes quantidades de dados de uma só vez, uma unidade falha. é um dos novos drives azuis, varia qual deles. Eu não acho que eles queriam que eu usasse drives azuis ... mas, bem, eles eram 30 $. economize para movimento de arquivo volumoso - esta instalação trabalhou impecavelmente durante aproximadamente 6 meses. Eu tive que reconstruir duas vezes.

agora para o problema:

outro dia, sobre um problema que aconteceu (o servidor está sem cabeça, eu não tinha um monitor conectado, e estupidamente quando não estava respondendo, eu apenas liguei). Após a reinicialização, nada apareceu. Eu conectei um monitor, e ele começou a mostrar que a minha partição massiva não poderia ser montada (é notado no fstab pelo UUID) ... então eu inicializei, e notei que no lado esquerdo, na barra de inicialização, ele mostrava 5 drives aleatórios (tamanhos aleatórios, um 2.8GB, um 17GB, etc ... nada perto de qualquer unidade em capacidade) .... em alguma pesquisa no sistema, percebi que, por algum motivo, quando a matriz falhou e começou a reconstruir , a tabela de partição foi apagada (eu acho) e de alguma forma agora está lendo uma tabela de partição de unidades individuais (a placa RAID mostra todas as 8 unidades, agora após a reconstrução, em operação funcional normal ... no entanto a tabela de partição ainda não aparece) / p>

Eu posso montar manualmente a partição, e ela age como se nada fosse o problema ... exceto na reinicialização, ela ainda tenta montar as outras 5 partições e não montará a única partição que realmente existe - o que é suposto para ser a unidade inteira, todos os 100% da unidade. na parted, a única coisa listada é uma partição, xfs, todos os 7001GB. a tabela é listada como loop (não como GPT, como era). blkid mostra as outras partições aleatórias - não mostra minha partição 7001GB.

Eu pesquisei e pesquisei, e a maioria dos lugares me diz para usar uma ferramenta chamada testdisk. isto é suposto encontrar suas partições, e recriar sua tabela de partição .... o problema é, como sempre com este arranjo raid ... com IO massivo, o array falha ou o sistema trava ... assim quando testdisk tenta ler todas as 800.000 unidades, recebe alguns milhares e congela. algumas outras ferramentas, gpart entre outras fazem exatamente a mesma coisa.

agora, eu sei quando cresci a partição do xfs no passado, eu poderia apenas apagar a partição e recriá-la. Eu poderia fazer a mesma coisa nesta instância, mas com a tabela de partições? apagaria os dados? A última vez que eu soube, a partição era literalmente a unidade inteira.

é possível eu estraguei alguma coisa durante a reconstrução da matriz e não reconstruí completamente a tabela de partições (se é que isso é possível). mas neste momento, não sei o que fazer. Eu poderia viver com isso e montar / dev / sdc a cada lançamento ... ou quem sabe.

toda e qualquer ajuda é apreciada. Eu posso fazer qualquer comando, e posso listar a saída.

    
por p4cm4n88 15.11.2015 / 21:03

0 respostas