Pode valer a pena executar fsck
(ou o equivalente para qualquer sistema de arquivos que você esteja usando) para corrigir erros de disco. Mas, pode ser a última coisa que esse disco faz se estiver em sua última etapa.
Eu tenho um disco rígido muito pequeno e bastante antigo, cerca de 32G.
Para este disco eu copiei um arquivo tar largish, cerca de 5G.
Quando executo o md5sum para gerar uma soma de verificação nesse arquivo, recebo repetidamente resultados diferentes (na mesma máquina e no mesmo arquivo). Isso obviamente não deveria acontecer.
Se eu repetir o experimento com um arquivo muito menor, como esperado, a soma de verificação será a mesma a cada vez. Eu só posso supor que, porque o arquivo grande está abrangendo a maior parte do disco, e é uma unidade antiga, estou tendo muitos erros de leitura no disco rígido - e ele precisa ser substituído? Poderia haver algum outro bom motivo para isso? Algo que posso fazer para corrigir o problema, além de comprar um novo disco?
Atualização: o sha1sum também produz resultados inconsistentes.
As únicas razões prováveis são mau disco ou RAM ruim, e como o disco é antigo e você não está tendo outros problemas, é menos provável que seja a RAM.
Poderia ser um conector / controlador dodgey: uma vez eu tive um adaptador USB IDE- > indo mal resultando em transferências corrompidas, mesmo achando que a unidade estava perfeitamente bem.
Para estar no lado seguro, sugiro que você execute memtest86 + durante a noite para ter certeza de que não há erros de memória.
A causa raiz é que, de alguma forma, a sua RAM está sendo corrompida. É provavelmente um problema, mas às vezes os dispositivos como a placa de vídeo podem corromper a memória principal.
Não efetue fsck até verificar se a memória é segura. Caso contrário, o fsck provavelmente corromperá tudo.
Retire as unidades, coloque em um sistema conhecido e o FSCK enquanto você conserta este sistema.
O sha1sum
tem o mesmo comportamento?
Eu esperaria erros de leitura de disco antes de receber dados fantasmas que alterassem o processo de hashing. Em qual plataforma você está correndo?
Eu já tive esse mesmo problema também. Acabou sendo o controlador de disco rígido da placa-mãe.
No entanto, neste caso, definitivamente soa como um disco rígido ruim. Os discos rígidos tendem a manter a vida marcando setores de maneira ruim, transparente e em segundo plano. Quando os setores finalmente começam a ficar ruins em um nível de sistema operacional, a unidade acaba expirando muito rapidamente.
Como os dados são diferentes cada vez, é possível que o md5sum possa ler cada vez menos após cada execução. Mas as leituras falhadas devem fazer com que o md5sum seja encerrado e relatar erros de entrada / saída.
É muito importante fazer o backup dos dados que você tiver nesta unidade e mudar para a nova unidade. Esta unidade pode falhar a qualquer momento. Não use esta unidade para qualquer trabalho importante.
Existe algum processo ou trabalho cron configurado para adicionar ou remover automaticamente arquivos desse arquivo tar?
Eu também executaria uma verificação de disco. Certifique-se, como você disse, de que não há problemas com o próprio disco.
Tags hard-drive hash linux filesystems