Compare a primeira coluna do primeiro arquivo e a segunda coluna do segundo arquivo e a correspondência

Question

Compare a primeira coluna do primeiro arquivo e a segunda coluna do segundo arquivo e a correspondência

#1 resposta do (0 votos)

0

Arquivo1: arquivo do Excel (.xls)

UN          ID    St      M1    M2       SE    DOF  PV        PA            FC
17127159    0   -5.9    297.3   765.7   0.22    4   0.003   0.00389231  2.57536
17127163    2   -3.87   189.914 492.307 0.3548  4   0.0179  0.01795     2.59226
17127167    4   -3.8908 339.136 855.276 0.3429  4   0.0176  0.017       2.52192
17127171    6   -3.922  390.44  986.365 0.340   4   0.0172179   0.01721 2.52627
17127175    8   -4.715  536.072 1210.65 0.2492  4   0.00920158  0.00920 2.258

Arquivo2: arquivo de texto (.txt)

UNIT_ID   UN      TID        X       E       GG7     J     O
0      17127159 16657436 353.568 335.295 221.717 815.654 684.85
1      17127161 16657436 11.0842 7.01459 7.33511 11.2121 12.6268
2      17127163 16657450 221.647 226.774 136.274 431.32  392.533
3      17127165 16657452 5.02182 3.41172 4.12834 6.90306 4.91183

Se a primeira coluna do 1º arquivo corresponder à segunda coluna do 2º arquivo, extraia as linhas correspondentes do 2º arquivo da coluna 3 para a coluna 9 e salve-as no primeiro arquivo.

Alguém pode me ajudar?

A saída deve ser salva em um novo arquivo

saída:

UN        ID   St  M1    M2    SE   DOF PV    PA    FC    TID     X  E  GG7  J O
17127159  0   -5.9  297.3   765.7   0.22    4   0.003   0.00389231  2.57536  16657436 353.568 335.295 221.717 815.654 684.85

grep text-processing r awk

por user3351523 31.03.2016 / 13:07

1 resposta

Tags grep text-processing r awk

Conecte-se a uma rede sem fio como usuário padrão sem autenticação de administrador Linux Mint 17.3 Substituir variável no valor da variável de ambiente chpst loaded

score 0 · Accepted Answer

Uma solução awk :

$ awk 'NR==FNR{a[$2]=$3"\t"$4"\t"$5"\t"$6"\t"$7"\t"$8"\t"$9; next} 
              {
                if($1 in a){
                    print $0,a[$1]
                }
               }' file2 file1
UN          ID    St      M1    M2       SE    DOF  PV        PA            FC TID  X   E   GG7 J   O   
17127159    0   -5.9    297.3   765.7   0.22    4   0.003   0.00389231  2.57536 16657436    353.568 335.295 221.717 815.654 684.85  
17127163    2   -3.87   189.914 492.307 0.3548  4   0.0179  0.01795     2.59226 16657450    221.647 226.774 136.274 431.32  392.533

Explicação

O awk divide cada linha de entrada em campos (no espaço em branco, por padrão), fazendo com que o primeiro campo $1 seja o segundo $2 etc. A variável especial NR é o número da linha de entrada atual e FNR é o número da linha atual do arquivo que está sendo lido. Portanto, ao processar vários arquivos, os dois são iguais apenas enquanto o primeiro arquivo está sendo lido.

NR==FNR{a[$2]=$3"\t"$4"\t"$5"\t"$6"\t"$7"\t"$8"\t"$9; next} : se estivermos lendo o primeiro arquivo, salve os campos 3 a 9 (unidos por tabulações) como o valor na matriz a cuja chave é o segundo campo. Em seguida, pule para a linha next .
O next garante que o restante do script não seja executado para o primeiro arquivo ( file2 ), mas somente o segundo ( file1 ).
if($1 in a){ print $0,a[$1] } : agora estamos no segundo arquivo ( file1 ). Se o primeiro campo existir como uma chave na matriz a ( if($1 in a) ), imprima a linha atual $0 e o valor armazenado em a para $1 : campos 3 a 9 de file2 .