Na verdade, é um problema de algoritmo bastante difícil, mas felizmente ele já foi escrito. O MusicBrainz Picard identificará as músicas por som e atribuirá a elas um nome baseado em um grande banco de dados de impressões digitais de áudio.
Se identificar uma duplicata, ela dará à música o mesmo nome que a original com um número anexado ao final, para que você possa excluir facilmente as duplicatas removendo qualquer música que tenha um número anexado ao final. Já faz alguns anos desde que usei o Picard, por isso é possível que uma remoção duplicada tenha sido adicionada.
MusicBrainz Picard link