diff onde as linhas são praticamente as mesmas mas fora de ordem?

20

Eu quero diferenciar dois conjuntos de regras mod_rewrite. O conjunto de linhas é aproximadamente 90% idêntico, mas a ordem é tão diferente que o diff basicamente diz que elas são completamente diferentes.

Como posso ver quais linhas são realmente diferentes entre dois arquivos, independentemente do número de linha deles?

    
por user394 25.10.2011 / 23:40

2 respostas

32

sort pode ser usado para colocar os arquivos na mesma ordem, então diff pode compará-los e identificar as diferenças. Se você tiver uma substituição de processo, poderá usá-la e evitar a criação de novos arquivos classificados.

diff <(sort file1) <(sort file2)
    
por 26.10.2011 / 00:35
7

Feito um script para isso, o qual mantém a seqüência de linhas intacta . Aqui está uma versão anotada das linhas importantes:

# Strip all context lines
diff_lines="$(grep '^[><+-] ' | sed 's/^+/>/;s/^-/</')" || exit 0

# For each line, count the number of lines with the same content in the
# "left" and "right" diffs. If the numbers are not the same, then the line
# was either not moved or it's not obvious where it was moved, so the line
# is printed.
while IFS= read -r line
do
    contents="${line:2}"
    count_removes="$(grep -cFxe "< $contents" <<< "$diff_lines" || true)"
    count_adds="$(grep -cFxe "> $contents" <<< "$diff_lines" || true)"
    if [[ "$count_removes" -eq "$count_adds" ]]
    then
        # Line has been moved; skip it.
        continue
    fi

    echo "$line"
done <<< "$diff_lines"

if [ "${line+defined}" = defined ]
then
    printf "$line"
fi
    
por 26.10.2011 / 11:41