Safer RAID5 mais seguro é reconstruído usando discos parcialmente com falha? [fechadas]

3

Houve muitos artigos postados recentemente sobre como o RAID5 é perigoso por causa dos longos tempos de resilver, e em particular por causa das crescentes chances de encontrar um URE durante o resilver. Obviamente, esta é uma preocupação significativa. No entanto, parece que em muitos casos de interesse (contanto que você esteja mantendo algum tipo de atenção em seus discos), quando chegar a hora de reconstruir a matriz, o disco que estou substituindo ainda é principalmente legível.

Se você tentar explicar essa situação para o leigo médio, eles normalmente ficarão muito confusos sobre o motivo pelo qual você tem dois discos quase completamente funcionais, mas não pode produzir um array funcional. Parece-me que deve haver alguma maneira de aproveitar isso para tornar as reconstruções mais seguras, desde que eu esteja disposto a fazer com que o RAID5 seja lido por apenas alguns dias enquanto ele é reconstruído. Conceitualmente, o que tenho em mente é algo assim:

  1. Quando um disco falha, retire o RAID5 imediatamente ou monte-o somente leitura
  2. Anexe um novo disco (em uma baia sobressalente ou externamente via eSATA) e comece a recriá-lo para substituir o que falhou. Se conhecido, talvez comece com as listras em que ocorreu a falha, para minimizar as chances de perdê-los se outro disco falhar.
  3. No caso de um segundo disco ter uma falha de URE ou outra durante a reconstrução, tente obter os dados do disco que está sendo substituído. Presumivelmente, se isso acontecer, mais reconstrução seria necessária.
  4. Ao concluir, desligue o servidor, troque a unidade de substituição para a baia original, se desejado, e faça o backup da matriz.

Obviamente, tal processo não seria apropriado para aplicações em que o tempo de atividade é crítico ou a perda de dados não pode ser tolerada, mas parece-me que isso poderia ajudar consideravelmente a melhorar a confiabilidade do RAID5.

Suponho que não há uma boa maneira de implementar uma recuperação como essa no momento, já que não vi nenhuma indicação de ferramentas projetadas para isso e que parece que seria um pouco obtuso trabalhar fora manualmente. Existem problemas técnicos com os quais eu não pensei (ainda sou relativamente novo no material RAID)? Qualquer pensamento sobre o quão difícil algo como isso seria implementar (por exemplo, no Linux md raid)?

EDIT : Caso alguém encontre isso enquanto procura a mesma coisa que eu, isso já é um par de recursos nas versões mais recentes do md. A lista de bloqueios inválidos (se ativada) permite que o md falhe em blocos individuais, em vez de discos inteiros, e o hot-replace permite que um novo disco seja construído trabalhando principalmente a partir do que está prestes a substituir, mas desenhando de outros discos no array. quando necessário. A manpage do mdadm recente tem mais instruções sobre como fazer isso.

    
por arcticmac 02.11.2013 / 01:27

0 respostas

Tags