Unindo colunas de arquivos se elas contiverem uma correspondência em outra coluna

1

Eu tenho dois arquivos:

Arquivo1.txt

30    40    A    T    match1    string1
45    65    G    R    match2    string2
50    78    C    Y    match3    string3

Arquivo2.txt

match1    60    add1    50    add2
match2    15    add1    60    add2
match3    20    add1    45    add2

e eu quero obter uma saída assim:

30    40    A    T    match1    string1    60    add1
45    65    G    R    match2    string2    15    add1
50    78    C    Y    match3    string3    20    add1

Eu quero anexar a coluna 2 e a coluna 3 do arquivo2.txt ao final do arquivo1.txt, se houver uma correspondência na coluna 5 do arquivo1.txt.

Eu tentei usar este comando de junção:

join -1 5 -2 1 -a 1 -o 1.1 -o 1.2 -o 1.3 -o 1.4 -o 1.5 -o 1.6 -o 2.2 -o 2.3 file1.txt fil2.txt

No entanto, isso só parece imprimir as colunas do primeiro arquivo. Existe alguma outra solução além da junção para resolver este problema?

    
por cosmictypist 07.03.2016 / 15:14

2 respostas

1

Eu encontrei uma solução:

awk -F "\t" 'FNR==NR {a[$1] = $2 "\t" $3;next} $5 in a{print $0 "\t" a[$5]}' file2.txt file1.txt > outing.txt
    
por 07.03.2016 / 16:45
2

Você pode fazer:

join -1 5 -2 1 -o 1.1,1.2,1.3,1.4,1.5,1.6,2.2,2.3 file1.txt file2.txt

Exemplo:

% cat f1.txt 
30    40    A    T    match1    string1
45    65    G    R    match2    string2
50    78    C    Y    match3    string3

% cat f2.txt 
match1    60    add1    50    add2
match2    15    add1    60    add2
match3    20    add1    45    add2

% join -1 5 -2 1 -o 1.1,1.2,1.3,1.4,1.5,1.6,2.2,2.3 f1.txt f2.txt
30 40 A T match1 string1 60 add1
45 65 G R match2 string2 15 add1
50 78 C Y match3 string3 20 add1
    
por 07.03.2016 / 15:30