Encontrar frases idênticas pode ser facilmente feito no Notepad ++:
- Use um regexp para ter cada frase em uma nova linha. Isso pode ser feito (por exemplo) procurando por todos os
.
e substituindo-os por.\n
- Remova todos os espaços brancos no início da linha.
- Agora, vá em frente e classifique as linhas (TextFX - > TextFX Tools)
- Converta o caractere EOL para UNIX porque ot torna as coisas mais simples (conversão Edit - > EOL)
- Agora, pesquise por linhas duplicadas pesquisando por
^([^\n]+)\n
Para encontrar frases semelhantes, você precisaria de algo como um programa de palavra ou algum tipo de busca fuzzy.