Como saber quanto (e quais) dados perdi após falha de disco

1

Um dos discos no meu cluster (com um RAID 5) morreu na semana passada e eu tive que substituí-lo. Após uma reconstrução e uma verificação de consistência, alguns dados pertencentes a diferentes usuários foram perdidos. Preciso saber exatamente quanto e quais dados perdemos. Existe algum arquivo de log ou programa / pacote disponível para esse fim (não há backups)?

Obrigado

    
por Paco el Cuqui 17.03.2016 / 00:29

1 resposta

0

Geralmente, as reconstruções não são reversíveis, o que significa que o processo normalmente não salva informações sobre como fazer o backup de um processo de recriação que não funciona corretamente. Em vez disso, as pessoas confiam nos backups.

Você sempre deve ter backups de dados importantes.

Outra maneira de identificar os dados alterados é usar um verificador de integridade de arquivos, como AIDE, Integrit ou Tripwire. Essa solução, no entanto, também exige a comparação com dados que foram feitos anteriormente.

Os registros podem ser úteis. Até mesmo uma listagem de diretório salva pode ser útil. No entanto, se você não tiver esses recursos, pode não haver uma maneira comumente conhecida de determinar as informações que você está procurando.

Para entender o motivo: foi mostrado como o RAID5 funciona usando o XOR. XOR é conhecido como a operação que simplesmente verifica a uniformidade. Assim, você tem duas unidades com dados que são monitorados e uma unidade de paridade que identifica se os dois bits correspondentes, encontrados nas outras duas unidades, são os mesmos. Se você perder a unidade de paridade, simplesmente a refaça. Se você perder uma das outras unidades, poderá recuperar observando a unidade de dados que permanece e observando se os bits foram os mesmos (conforme registrados pela unidade de paridade) e, em seguida, descobrir qual parte estava na unidade de dados. unidade que foi perdida.

Lá é isso. É simples assim. * Infelizmente, se o processo falhar por algum motivo, pode não haver um método mágico para descobrir que coisa ruim específica aconteceu e que coisa boa específica deveria ter acontecido. Como resultado, não há um caminho claro para o software saber como simplesmente "consertar" a situação. Eu sei que esta não é a notícia que você estava esperando. Desculpe.

. * Bem, eu disse que é simples assim. Na verdade, meu entendimento é que implementações reais de RAID geralmente têm cabeçalhos que complicam as coisas, como incompatibilidades com outras implementações de RAID. No entanto, o cabeçalho é uma parte específica da unidade, relativamente pequena em comparação com o espaço total da unidade. Portanto, se houver problemas que afetem outras áreas da unidade, que seriam a maior parte da unidade, provavelmente você não encontrará salvação.

    
por 18.03.2016 / 07:13