O software raid10 falhou com 3 discos

1

Eu tenho 4 discos, várias partições e de algumas partições raid10 arrays. Algo deu errado e três discos "falharam" ao mesmo tempo (acho que foi um problema de software, os discos estão ok). Agora eu não tenho trabalho array. Existe uma maneira de recriar o array com todos os dados dessas partições? Os dados devem estar ok, eu preciso apenas reconstruir e sincronizar a matriz, mas não sei como (não quero perder dados, embora tenha backups, mas todo o processo de restauração levará ~ 20 horas).

Obrigado pela sua ajuda!

    
por Bruce 14.08.2012 / 23:58

2 respostas

3

Supondo que suas unidades ainda estejam em boas condições, você provavelmente precisará dedicar algum tempo para determinar exatamente como sua matriz foi configurada. Usando mdadm --examine e --detail nas partições e volumes individuais.

Em seguida, você poderá recriar o array usando a opção --assume-clean , que criará um novo array sem fazer nada com os dados. Se você recriar a matriz usando os parâmetros corretos, poderá montar seu volume dependendo de como ele falhou e do nível de corrupção resultante da falha.

Se conseguir levantá-lo, você desejará forçar uma ressincronização e provavelmente seria uma boa ideia verificar se seus dados não foram corrompidos.

Se você não estiver familiarizado com o processo, pode ser mais fácil reconstruir sua matriz agora e depois restaurá-la. Gastar tempo tentando reconstruir o volume é um pouco arriscado. Se você não tiver sorte, seu volume pode estar em um estado em que simplesmente não pode ser corrigido e você precisa restaurar de qualquer maneira. Pode ser melhor começar a restauração agora.

Em um mundo ideal, você teria um segundo conjunto de discos que poderia ser restaurado enquanto tenta recuperar o original. Se você puder restaurar e tentar recuperar o volume em paralelo, sugiro que faça isso.

    
por 15.08.2012 / 00:50
1

Normalmente, se três discos falharem em um array RAID10, sua capacidade de recuperação será basicamente nula (você poderá forçar o sistema de arquivos a fornecer algo, mas a metade de seus dados terá desaparecido).

Eu duvido, se o controlador achar que as unidades falharam, que elas estão completamente OK; no mínimo, as informações do RAID estão corrompidas. Você pode ser capaz de acessar as unidades usando o LVM no Linux, se estiverem OK. Caso contrário, é um trabalho de recuperação de dados e seus backups seriam uma opção muito melhor.

    
por 15.08.2012 / 00:09

Tags