Por que um controlador RAID não pode imitar as ações de um controlador de unidade em um URE?

0

Existe um fato: um URE torna um membro inteiro de um array RAID tão ruim, mas um URE NÃO torna uma unidade inteira tão ruim fora de um array. Qual é a diferença técnica que faz isso? Ambos são vistos de forma semelhante no nível do sistema operacional, portanto, deve ser algo abaixo do SO e da formatação.

Do meu entendimento, quando um único membro de um RAID 5 falha, o controlador RAID começa a reconstruir um disco substituído, comparando os outros valores junto com a paridade para gravar o valor correto no novo disco. Quando um URE acontece, "ele" detecta "dados corrompidos" por meio do "erro de leitura", "ele" não pode corrigir o "erro de leitura" e interrompe a reconstrução e marca o segundo membro como ruim. Se você tiver redundância única, isso tornará a matriz inutilizável.

Por que o conjunto INTEIRO é inutilizável ao encontrar um URE? Por que não apenas essa faixa de informação? Parece que a localização na matriz pode ser facilmente observada, a tabela de arquivos marcada e os arquivos corrompidos listados para que os arquivos corrompidos possam ser adicionados novamente à matriz a partir de backups. / p>

Por exemplo, em um único disco, o controlador da unidade apenas marcaria o setor como ruim e seguiria em frente; o controlador de unidade NÃO marcaria o disco inteiro e a (s) partição (ões) como "ruim". Por que um controlador RAID não pode imitá-lo e ter resultados iguais ou semelhantes?

Além disso, a pergunta secundária para backround que pode se relacionar é um URE um "erro grave" em que cada leitura do mesmo setor falha (relacionados ao prato) ou um erro de "leitura suave" ocorrido uma vez (transferência de dados relacionada) dados sobre o prato ainda é bom? Se este último, seria a pergunta de por que não tentar a leitura novamente? Ou é o primeiro?

Por que um controlador RAID não pode imitar as ações de um controlador de unidade em um URE?

Tl; Dr

Isso < A pergunta é a mesma pergunta, mas o discurso parecia lançar a resposta e o tom de toda a discussão para o lado. As "respostas" de "O objetivo do RAID é manter o sistema de arquivos utilizável após a morte de um disco. Não substituir um backup de garantia de uma reconstrução bem-sucedida." e "um Erro de leitura irrecuperável Ao ler a fonte da qual você está construindo, é impossível reconstruir corretamente a matriz daquela fonte corrompida. " não responde a essa pergunta.

Não discuta aqui. Deve haver alguma diferença técnica fundamental entre a maneira como o controlador RAID "vê" as coisas em comparação com uma única unidade que deve causar esse comportamento; Qual é essa diferença técnica? Eu posso responder logicamente a minha própria pergunta; um controlador de raid vê o array como uma unidade única em que uma unidade pensa em coisas em termos de setores individuais. Mas parece que uma solução para isso poderia ser implementada de forma semelhante a como um único disco faz as coisas e permitiria que as coisas fossem utilizáveis novamente, então eu devo estar perdendo alguma coisa.

Este tópico no Spiceworks alude há um problema real com os UREs, mas é complicado. Vários links no encadeamento para seguir.

    
por Damon 30.12.2017 / 18:08

0 respostas