Existe alguma maneira de encontrar arquivos semelhantes (não duplicados)?

11

Meu objetivo final é refatorar o código escrito por meus colegas de trabalho. Então, existe uma ferramenta que pode encontrar arquivos diferentes em poucas palavras?

(Edit: isto é para um Mac, mas outros podem gostar de respostas que não sejam Mac também.)

    
por tig 20.06.2010 / 15:45

2 respostas

5

Simian faz isso para o código-fonte de alguns idiomas. É melhor encontrar codificação copy-n-paste flagrante. Sua evolução parece ter parado, mas funciona bem o suficiente.

    
por 20.06.2010 / 16:14
2

(para Windows)

O produto Anti-Twin (gratuito para uso privado) claims para poder fazer isso:

If you want Anti-Twin not only to search for full duplicates but also to similar files, you can reduce the desired minimum match from the default value of 100% to up to 60%. This function has been particularly designed for the search of almost identical files where only a tiny detail was changed. Anti-Twin uses the similarity search as soon as you enter a value below 100%. The similarity comparison takes much longer than the 100% full duplicate search!

Unfortunately, the similarity search as part of the byte-by-byte comparison only makes sense for a few file types, because a similarity can only be detected if the files are uncompressed and unencrypted. Uncompressed files are e.g. unformatted texts (.TXT) and HTML.

    
por 20.06.2010 / 22:04