Há muitas maneiras de fazer isso, aqui está uma solução com gawk 4.x
:
$ awk '
FNR < 2 { next }
FNR == NR {
for (i = 2; i <= NF; i++) {
a[$1][i] = $i;
}
next;
}
($1 in a) {
for (i = 2; i <= NF; i++) {
if (a[$1][i] == $i) {
printf("%s->Col%d: Equal\n", $1, i-1);
} else {
printf("%s->Col%d: Not Equal\n", $1, i-1);
}
}
}
' file1.txt file2.txt
row2->Col1: Not Equal
row2->Col2: Not Equal
row2->Col3: Not Equal
row1->Col1: Not Equal
row1->Col2: Not Equal
row1->Col3: Not Equal
Explicação
-
FNR < 2 { next }
: pule as duas primeiras linhas -
FNR == NR
: true apenas quando processamos o primeiro arquivo. Nós salvamos cada valor de coluna no array associativoa
, com o formulárioa[ROW][COLUMN]
. -
($1 in a)
: verifique se a linha no arquivo2 existia no arquivo1. Se true, percorremos todo o valor da coluna, compare com o valor no arquivo1.
Com a versão gawk
mais antiga, você pode tentar:
$ awk '
FNR < 2 { next }
FNR == NR {
for (i = 2; i <= NF; i++) {
a[i,$1] = $i;
b[$1];
}
next;
}
($1 in b) {
for (i = 2; i <= NF; i++) {
if (a[i,$1] == $i) {
printf("%s->Col%d: Equal\n", $1, i-1);
} else {
printf("%s->Col%d: Not Equal\n", $1, i-1);
}
}
}
' file1.txt file2.txt