Se seus arquivos de origem estiverem completamente intocados, a execução de um hash / soma de verificação em seus arquivos deverá produzir os mesmos resultados para os arquivos inalterados. Em seguida, basta excluir arquivos com hashes duplicados.
Eu tenho arquivos de eventos crontab para .tar.gz algumas pastas a cada N horas. Finalmente eu tenho uma coleção de arquivos .tar.gz . Agora eu quero remover arquivos duplicados (criados enquanto os arquivos de destino permanecem inalterados) Como posso fazer isso?
Eu tentei fazer comparações verificando o hashsum, mas os arquivos tar.gz sempre têm uma soma diferente:
altera@nuclight:~$ rm -rf *
altera@nuclight:~$ echo "Hello world" > file
altera@nuclight:~$ tar czf a1.tgz file
altera@nuclight:~$ tar czf a2.tgz file
altera@nuclight:~$ tar czf a3.tgz file
altera@nuclight:~$ tar czf a4.tgz file
altera@nuclight:~$ tar czf a5.tgz file
altera@nuclight:~$ ls
a1.tgz a2.tgz a3.tgz a4.tgz a5.tgz file
altera@nuclight:~$ md5sum *.tgz
e8587f4c381856af9278a6ef2a452b00 a1.tgz
2f44617fb164e66a74c5c4992637e7d4 a2.tgz
1a094b315e2d0891a0c5dafebae9718f a3.tgz
6c3642d2441397c24e4de5377b9e0a7e a4.tgz
7c0e9128ef47a9dbcda0dd008e34cd8d a5.tgz
altera@nuclight:~$
Se seus arquivos de origem estiverem completamente intocados, a execução de um hash / soma de verificação em seus arquivos deverá produzir os mesmos resultados para os arquivos inalterados. Em seguida, basta excluir arquivos com hashes duplicados.