Alguns dias copiei um arquivo grande (56 GB) de uma estação de trabalho para um servidor de arquivos. Depois de verificar a cópia, descobri que ela tinha alguns bytes diferentes do original.
Detalhes:
O arquivo foi copiado arrastando e soltando na estação de trabalho do disco local para a pasta compartilhada da rede (no servidor). O tamanho do arquivo é 56886041991 bytes.
Uma segunda cópia feita da mesma maneira um dia depois foi OK (verificada por md5sum). Comparando revela que há 97 bytes diferentes. (ver abaixo) O único padrão que vejo é que os bytes quebrados são agrupados em três grupos, onde cada byte 128 é alterado.
O que posso fazer? Onde começar a procurar a causa? Ele não pode ser os discos no servidor, pois eles reportariam um erro de leitura em caso de corrupção, e mesmo que não, o ReFS não notaria a soma de verificação incorreta e leria o setor do outro disco e se isso também estiver corrompido, deve (deve) relatar um erro de leitura. SATA tem CRC. RAM tem ECC. Rede tem 2 camadas de checksums. A estação de trabalho não possui memória ECC. Talvez erros de driver de rede?
Saída de cmp -l
: veja aqui
Testes adicionais realizados entretanto:
md5sum /dev/sdX
em um loop: 5 vezes executadas no disco de 5 TB, mais de 20 vezes em outras - nenhum erro detectado Eu acho que foi um raio cósmico solitário ...