Compare dois arquivos e recupere os resultados correspondentes

3

Eu tenho dois arquivos.Arquivo1 contém

470.2843    organism AR_0036     123    Intermediate
470.2845    organism AR_0033    456 Susceptible
903909.3    organism Naval-83   789 Resistant

e o arquivo2 contém

123
456
abc
def
789

Eu quero minha saída de forma que: se nos valores do arquivo2 não corresponderem ao arquivo1, o perl deixará essas linhas em branco no arquivo de saída; ou se corresponder, imprima os dados correspondentes da linha correspondente no arquivo de saída.

#!/usr/bin/perl
my $file1 = '/Users/apple/Desktop/ncbi_ab_data/new_file1';
my $file2 = '/Users/apple/Desktop/ncbi_ab_data/new_file2';
open my $fh1, '<' , $file1;
while (<$fh1>){
    chomp;
    my @file1 = split('\t', $_ );

        #print "$file1[0]\t";
        #print "$file1[1]\t";
        #print "$file1[2]\t";
        #print "$file1[3]\t\n";

    open my $fh2, '<' , $file2;
    while (<$fh2>){
    chomp;
    my @file2 = split('\t', $_ );
    #if ($file2[0] == $file1[2])
    #print "$file2[0]\n";
    if ($file2[0] = $file1[2]){
        print "$file2[0]";
        print "\t$file1[3]\n";

    }
    #print "$file1[0]\n";
    #print "$file2[1]\n";
    #print "$file2[2]\n";
    #print "$file2[3]\n";
    #print "$file2[4]\n";
    }
}

Eu escrevi este código, mas ele não funciona corretamente.

    
por Tina Sharma 12.12.2017 / 06:25

1 resposta

1

Pode-se usar join (para imprimir e combinar o campo 4 do arquivo1 com o campo 1 do arquivo2) e classificar (para produzir dados de entrada ordenados no campo 4 e campo 1 do arquivo1 e arquivo2, resp.) para executar a correspondência:

 join -o 2.1,1.3 -1 4 -2 1 <(sort -k 4 file1) <(sort -k 1 file2)

Usando seus dados de amostra, produz

 123 AR_0036
 456 AR_0033
 789 Naval-83

Em relação ao seu script, acho que o índice 2 em

 if ($file2[0] = $file1[2]){

está errado.

    
por 12.12.2017 / 07:20