Use um formato de arquivo como cpio ou tar para preservar os links físicos. Veja cpio(1) e tar(1) .
Além disso, cp só preserva links físicos se você usa -l ou -a .
[EDIT] Todas as ferramentas no Unix detectam links físicos observando o número do inode (primeiro número na saída de ls -li ). Se o número for diferente, nenhuma ferramenta poderá recriar os links físicos.
Para corrigir o problema, sugiro criar checksums MD5, classificá-los e depois filtrar por duplicatas ( uniq -d ). Você não precisará criar somas de verificação em todos os lugares porque a maioria dos links físicos estarão em bin diretórios.
Depois, você pode manter o primeiro arquivo e vincular o resto.