Uma possibilidade é um flip aleatório de bit na RAM ou o controlador em leitura na etapa 4. Se os dados foram corrompidos em leitura, você os veria na etapa 4, então, se ainda estivesse em cache, você também os veria na etapa 6 ao comparar arquivos, uma vez que os dados corrompidos em cache ainda podem ser usados.
Para testar esse caso, ligue e desligue todo o hardware para garantir que os caches sejam limpos e tente abrir o arquivo (e executar a comparação com o backup) novamente. Se tudo estiver bem, então este foi o problema (não há como saber em que fase da leitura ocorreu o bit flip, então você terá que considerar isso como um mistério não resolvido). †
Se isso falhar, uma segunda possibilidade, ainda mais desagradável, talvez seja uma RAM aleatória (ou, mais provavelmente, no controlador RAID, com base em sua descrição) bit flip on write no passo 1; mas você estava operando em uma boa cópia em cache nas etapas 2 e 3, apesar de uma cópia corrompida existente no disco. Uma semana depois, quando você acessou os dados novamente, é claro que você os leu novamente do disco e acabou com os dados corrompidos que haviam sido gravados originalmente. Isso faz muitas suposições e depende de um pouco de azar. Se este for o caso, você apenas terá que restaurar o arquivo de backup e seguir em frente.
Essas são as únicas duas coisas em que posso pensar, na verdade. Não parece um problema com as próprias unidades. De qualquer forma, já que não há como saber onde no hardware ocorreu o erro, eu recomendo executar um diagnóstico de memória completa apenas para ser seguro, embora a causa seja mais infeliz EMI ou raios cósmicos . Como o canadense Luke mencionou em sua resposta , a ECC RAM, se a sua placa-mãe suportar, protegerá contra esse tipo de evento, a menos no lado da RAM. Na verdade não é incomum a todos.
† Este caso acabou sendo o problema do OP, e não a segunda possibilidade.