Como encontrar a causa de uma corrupção de conteúdo de arquivo de evento único?

2

Alguns dias copiei um arquivo grande (56 GB) de uma estação de trabalho para um servidor de arquivos. Depois de verificar a cópia, descobri que ela tinha alguns bytes diferentes do original.

Detalhes:

  • sistema de origem:
  • sistema de destino:
    • HP ProLiant MicroServer N36L, RAM ECC
    • Windows Server 2012 R2 Standard
    • ReFS no espelho bidirecional dos Espaços de Armazenamento

O arquivo foi copiado arrastando e soltando na estação de trabalho do disco local para a pasta compartilhada da rede (no servidor). O tamanho do arquivo é 56886041991 bytes.

Uma segunda cópia feita da mesma maneira um dia depois foi OK (verificada por md5sum). Comparando revela que há 97 bytes diferentes. (ver abaixo) O único padrão que vejo é que os bytes quebrados são agrupados em três grupos, onde cada byte 128 é alterado.

O que posso fazer? Onde começar a procurar a causa? Ele não pode ser os discos no servidor, pois eles reportariam um erro de leitura em caso de corrupção, e mesmo que não, o ReFS não notaria a soma de verificação incorreta e leria o setor do outro disco e se isso também estiver corrompido, deve (deve) relatar um erro de leitura. SATA tem CRC. RAM tem ECC. Rede tem 2 camadas de checksums. A estação de trabalho não possui memória ECC. Talvez erros de driver de rede?

Saída de cmp -l : veja aqui

Testes adicionais realizados entretanto:

  • 24 horas de memtest86 + v5.01 nos dois PCs, sem erros
  • 24 horas de memtest86 v4.3.7 em ambos os PCs, sem erros
  • SMART teste longo em todos os HDDs: sem erros (exceto em um que eu sei que tem alguns setores defeituosos, eles estão fora de partições ativas)
  • md5sum /dev/sdX em um loop: 5 vezes executadas no disco de 5 TB, mais de 20 vezes em outras - nenhum erro detectado
  • repetiu a operação de cópia da mesma forma que originalmente 10 vezes, resultado verificado: sem erros

Eu acho que foi um raio cósmico solitário ...

    
por David Balažic 18.01.2017 / 00:10

0 respostas