Mdadm Raid 5 Array com 2 unidades com falha

1

Minha configuração é a seguinte

/ dev / sdb / / dev / sdc / / dev / sdd / / dev / sdf /

Eu tenho as seguintes 4 unidades de 1,5 TB em um array mdadm raid 5. Um dos discos (sdb) morreu em mim liderando a matriz para iniciar a execução no modo degradado.

Nenhum problema eu pensei, pois esta é a razão pela qual eu configurei uma matriz de raid 5 em primeiro lugar. Eu tinha um disco sobressalente de 1,5 TB em branco para substituir o disco sdb morto, então eu o formatei e adicionei ao array. No entanto, é aí que o problema realmente começa.

Ao recuperar o array após adicionar um novo disco, a recuperação falha a cada vez, embora nem sempre com a mesma porcentagem. Após a recuperação falhar, o sdc é marcado como um dispositivo com falha e também removido da matriz, embora possa ser forçado a ser adicionado novamente.

Aqui estão algumas das saídas do syslog

Jan 5 01:16:28 serverlol kernel: [11303.917452] md/raid:md0: Disk failure on sdc1, disabling device. Jan 5 01:16:28 serverlol mdadm[3345]: Fail event detected on md device /dev/md0, component device /dev/sdc1

Aqui está a saída do syslog quando a falha ocorre

Jan 5 01:16:24 serverlol kernel: [11300.853422] end_request: I/O error, dev sdc, sector 693768801 Jan 5 01:16:24 serverlol kernel: [11300.853426] md/raid:md0: read error not correctable (sector 693766752 on sdc1). Jan 5 01:16:24 serverlol kernel: [11300.853429] md/raid:md0: read error not correctable (sector 693766760 on sdc1). Jan 5 01:16:24 serverlol kernel: [11300.853432] md/raid:md0: read error not correctable (sector 693766768 on sdc1). Jan 5 01:16:24 serverlol kernel: [11300.853434] md/raid:md0: read error not correctable (sector 693766776 on sdc1). Jan 5 01:16:24 serverlol kernel: [11300.853436] md/raid:md0: read error not correctable (sector 693766784 on sdc1). Jan 5 01:16:24 serverlol kernel: [11300.853438] md/raid:md0: read error not correctable (sector 693766792 on sdc1). Jan 5 01:16:24 serverlol kernel: [11300.853441] md/raid:md0: read error not correctable (sector 693766800 on sdc1). Jan 5 01:16:24 serverlol kernel: [11300.853443] md/raid:md0: read error not correctable (sector 693766808 on sdc1). Jan 5 01:16:24 serverlol kernel: [11300.853446] md/raid:md0: read error not correctable (sector 693766816 on sdc1). Jan 5 01:16:24 serverlol kernel: [11300.853448] md/raid:md0: read error not correctable (sector 693766824 on sdc1).

Eu executei o smartctl em / dev / sdc e vejo que definitivamente existem alguns erros, estou executando os mesmos testes em outras unidades da matriz, mas demora muito para ser concluído em unidades desse tamanho.

Ok, então aqui estão as etapas de recuperação que tirei até agora, solicitei um disco rígido de 4 TB externo no qual pretendo fazer o backup de todos os dados possíveis do array degradado. Isso ocorre porque o array ainda pode ser montado e navegado enquanto estiver no modo degradado. Embora, é claro, presumivelmente, esse não seja o caso de todos os dados contidos nele. No momento, parei o mdadm e desmontei o array enquanto aguardava a chegada do disco de backup de 4 TB.

Meu plano atual é usar a ferramenta "safecopy" para recuperar o máximo de dados possível para o disco rígido externo. Este é o melhor utilitário para copiar os dados do meu dispositivo / dev / md0 degradado?

Este é meu melhor curso de ação para recuperar o máximo possível dos meus dados? Ou há mais alguma coisa que eu possa fazer para resolver o problema?

Eu tenho um disco de substituição para a unidade com falha inicial (sdb), mas não tenho mais unidades de 1,5 tb para substituir a outra sendo marcada como com falha (sdc). É por isso que eu só quero recuperar o máximo de dados que puder para o disco externo, depois eu provavelmente vou construir um array inteiramente novo, já que esses drives de 1.5TB são bem antigos.

    
por user2976138 05.01.2015 / 13:20

0 respostas