raid5 troque 1 de 3 discos rígidos [duplicados]

3

Eu quero trocar um disco rígido que está em um estado anterior à falha (alguns setores realocados) que é usado em um array raid5 com 3 discos (invasão de software com mdadm ).

É possível definir um novo disco rígido como um hot-spare e inicializar uma aquisição da falha para a unidade sobressalente?

Alguns métodos sugerem adicionar a unidade e, em seguida, definir um comando de falha da unidade. Como eu sei, nesse estado o raid5 é degradado e uma falha no drive acabaria em ....

Então existe a possibilidade de "copiar" os dados ao vivo (ou reconstruir o raid) da unidade com falha para o sobressalente (sem tirar sua função de paridade), e quando o processo de cópia ou reconstrução estiver concluído, remova a falha dirigir.

    
por raoul 25.11.2013 / 10:50

2 respostas

5

Sim, você pode (desde que tenha uma 3.2 + kernel ). Primeiro, adicione uma nova unidade como sobressalente:

mdadm /dev/md0 --add /dev/sdc1

(substitua md0 e sdc1 pelo seu dispositivo RAID e disco, respectivamente).

Em seguida, inicie uma operação de substituição de cópias como esta:

echo want_replacement > /sys/block/md0/md/dev-sdd1/state 

Em que md0 é, novamente, seu dispositivo RAID e sdd1 é a unidade com falha. (Na verdade, o sdd1 é uma partição na unidade com falha - prefiro criar conjuntos de RAID em partições, e não em discos brutos).

O sistema copiará todos os blocos legíveis de sdd1 para sdc1 . Se chegar a um bloco ilegível, ele será reconstruído a partir da paridade. Quando a operação estiver concluída, a antiga reserva (aqui: sdc1 ) ficará ativa e a unidade com falha será marcada como com falha (F) para que você possa removê-la.

    
por 25.11.2013 / 12:05
-1

Você poderia aumentá-lo para o RAID 6. Isso permitiria duas falhas nas unidades. E integraria seu novo disco em seu RAID existente sem remover o antigo.

Por outro lado, isso vai misturar todos os dados. Assim, a sincronização levará mais tempo, e você terá que fazer a mesma coisa novamente se quiser remover o disco defeituoso e reverter para o RAID 5. E esses crescimentos e embaralhamento de dados vêm com seus próprios perigos, particularmente no caso de perda de energia inesperada. . Ou, no caso de falha de unidade única, o crescimento continuaria, sem o disco com falha, quando os dados desse disco "com falha" se tornarão inúteis, pois não compartilharão mais o mesmo layout com o restante.

Não é realmente recomendado no geral.

Se a segurança de dados é sua principal preocupação, (em vez de tempo de atividade), atenha-se ao RAID5 e substitua o disco de um sistema de recuperação em que nada grave no RAID enquanto ele ressincroniza; Se uma unidade falhar durante a sincronização, você não perderá nada que já não esteja perdido. Se você fizer um backup de cada metadado dos discos md antes de iniciar a remoção / adição / ressincronização, você pode facilmente remontar usando a configuração original.

A maioria das pessoas acabou de ler o disco e confiar que funcionará; para o caso em que não funciona, você tem que fazer uso de seus backups.

É raro as unidades falharem ao mesmo tempo; na maioria dos casos, a unidade já falhou há muito tempo, você apenas nunca percebeu devido à falta de monitoramento.

    
por 25.11.2013 / 11:11

Tags