Avaliar diferenças entre dois arquivos [fechados]

1

Existe uma maneira no Unix de avaliar como dois arquivos de texto são semelhantes ou diferentes?

Eu sei sobre diff , mas isso me dá as diferenças. O que eu sou depois é apenas receber como uma resposta, algum tipo de avaliação do quanto esses dois textos são semelhantes. Eles contêm muito as mesmas palavras, são os textos muitas vezes bastante semelhantes, etc É realmente muito complicado avaliar isso de uma forma de alta qualidade, então eu estou querendo saber se alguém já fez isso.

Seria bom apenas receber um número, poderia ser 0 significa que eles são idênticos e um número alto significa que eles não são nada parecidos.

    
por Hermann Ingjaldsson 01.11.2016 / 10:48

1 resposta

2

Existe diffstat que lê diff de saída normal e imprime algumas estatísticas mais sobre linhas apenas .

diff -u fileA fileB | diffstat

ou wdiff para lidar com diffs de palavras .

wdiff -123 --statistics fileA fileB

Você também pode ler as man pages para encontrar algumas opções mais interessantes.

    
por 01.11.2016 / 11:02

Tags