Use ssdeep
para gerar um arquivo de hash:
ssdeep 'find . -type f' > hash
Isso dará aos pares 90% de < = similaridade < 100%:
ssdeep -m hash 'find . -type f' | grep -E '9[0-9].$'
Isso só funciona se longos trechos (blocos com cerca de 1% do tamanho do arquivo) forem os mesmos.