fdupes
pode fazer isso. De man fdupes
:
Searches the given path for duplicate files. Such files are found by comparing file sizes and MD5 signatures, followed by a byte-by-byte comparison.
No Debian ou no Ubuntu, você pode instalá-lo com apt-get install fdupes
. No Fedora / Red Hat / CentOS, você pode instalá-lo com yum install fdupes
. No Arch Linux você pode usar pacman -S fdupes
, e no Gentoo, emerge fdupes
.
Para executar uma verificação descendente da raiz do sistema de arquivos, o que provavelmente levará uma quantidade significativa de tempo e memória, use algo como fdupes -r /
.
Conforme solicitado nos comentários, você pode obter as maiores duplicatas fazendo o seguinte:
fdupes -r . | {
while IFS= read -r file; do
[[ $file ]] && du "$file"
done
} | sort -n
Isso será interrompido se seus nomes de arquivo contiverem novas linhas.