Duplicate Cleaner faz isso
Você pode encontrar arquivos especificando a busca por duplicatas por qualquer combinação de:
* Same Content (MD5 checksum)
* Same File Name
* Same Size
* Same Date (Note - this is the file's Modified Date)
Eu tento consolidar drives antigos para novos de maior capacidade. Às vezes, os arquivos foram renomeados, mas são idênticos. Às vezes, um diretório antigo tem apenas mais alguns arquivos do que um diretório mais recente com o mesmo nome. Às vezes, um arquivo tem o mesmo nome, mas o tamanho é diferente.
Por isso, muitas vezes me pergunto:
Existem arquivos nesta unidade ou diretório antigo que eu ainda não copiei para a nova unidade?
Eu só quero saber que tenho os arquivos, não quero tentar sincronizar automaticamente as coisas (as ferramentas de Sincronização tendem a apenas sincronizar, criando estruturas de pastas duplicadas e outros problemas, então prefiro fazê-lo manualmente) .
Basicamente, se uma unidade antiga tiver um arquivo chamado "foo.bar" com dez diretórios, e minha nova unidade grande tiver um arquivo idêntico chamado "oldstuff.zip" na raiz, eu só quero um "sim, você tem isso "ou" não, arquivos únicos existem ".
Existe uma ferramenta gratuita, um script ou um método rápido e fácil (Mac / Unix ou Windows) para obter a resposta?
Duplicate Cleaner faz isso
Você pode encontrar arquivos especificando a busca por duplicatas por qualquer combinação de:
* Same Content (MD5 checksum)
* Same File Name
* Same Size
* Same Date (Note - this is the file's Modified Date)
Até onde sei, não existe essa ferramenta, já que é praticamente um programa que apenas inclui algumas pessoas.
A possível solução para isso seria verificar tudo (bem, você poderia definir uma lista de extensões para limitar a varredura, pois a lista de todos os arquivos pode ser enorme e precisaria de muitos arquivos desnecessários) em uma unidade e criar checksum CRC32 para cada arquivo. Em seguida, em outra execução, o programa teria que verificar (comparar a soma de verificação CRC32) cada arquivo encontrado na nova unidade com a lista criada anteriormente e anunciar os arquivos ausentes.
Talvez, se houvesse interesse suficiente, algum programador / roteirista talentoso pudesse consertar isso para colocar seu orçamento em funcionamento.
Uma ferramenta para detectar "arquivos duplicados" seria capaz de produzir um relatório dos arquivos que foram armazenados em backup.
Easy Duplicate Finder (agora comercial, a versão freeware não está mais disponível) pode fazer isso por você. Até exportará listas de duplicatas. Basta apontá-lo para o diretório de origem e o diretório de destino.
Posso mencionar que a única maneira confiável de fazer isso é através de um teste de hash (crc32 ou md5 ou sha1)? O Easy Duplicate Finder usa CRC, então você pode ter certeza.
Para Linux (e talvez outros sistemas, não tenho certeza) existe o programa fdupes . Eu uso para encontrar arquivos duplicados (mas não lista arquivos únicos).
Além disso, a página fdupes na Wikipedia também lista muitas outras ferramentas semelhantes.