Como apagar duplicatas de arquivos no diretório e subdiretórios?

4

Existe algum método rápido para excluir duplicatas de arquivos com base em qualquer soma de hash (ou seja, SHA1 para ser rápido). Porque eu tenho uma bagunça em meus arquivos de música.

    
por Hauleth 09.12.2011 / 19:16

3 respostas

6

Existe o pacote fdupes no linux (por exemplo, ele está presente no repositório debian). Ele usa md5sums e, em seguida, uma comparação byte a byte para localizar arquivos duplicados em um conjunto de diretórios. Ele também pode excluir dups com a opção -d, mas nunca usei essa opção. Também você pode grep ou sed de arquivos de saída para excluir e removê-los do disco.

    
por 09.12.2011 / 19:35
3

Você encontrará este pipeline de utilitários de texto unix / linux muito útil. Este comando primeiro compara o tamanho dos arquivos e se o tamanho é o mesmo, então só compara o hash.

OR

Você pode usar o utilitário fdupes para identificar arquivos duplicados.

Ambas as soluções usam md5 hash

    
por 09.12.2011 / 19:35
2
O

liten2 link funciona também no mac osx!
É um script python com alguns recursos muito úteis, como corridas secas, deleção interativa e muito mais ...
E é muito rápido.

    
por 09.12.2011 / 20:14

Tags