esta é a minha primeira pergunta neste site, então, por favor, desculpe se eu não explicar isso bem. Eu sou um novato também. Eu estudei algumas coisas de linha de comando em perl e unix, mas não consigo descobrir como resolver isso.
Eu tenho 2 arquivos - Arquivo A, que é o arquivo mestre com mais de 10 colunas e aproximadamente 15.000 linhas, e Arquivo B, que contém 4 colunas e cerca de 1.500 linhas.
Eu quero pegar cada linha de cada vez no Arquivo B, e combinar essas colunas com as colunas correspondentes no Arquivo A (elas não estão na mesma ordem entre os dois arquivos, mas os cabeçalhos das colunas são os mesmos). Se houver uma correspondência em todas as 4 colunas do Arquivo B no Arquivo A, remova toda a linha do Arquivo A e coloque em um novo arquivo (Arquivo C).
Exemplo:
Arquivo A
individual_id study_id.x chromosome g_start gene referencel1hs SampleFile_num id sample_name
54 Baillie2011 4 57497067 na no 612 612 DonorAR2
54 Baillie2011 X 154790187 TMLHE no 612 612 DonorAR2
54 Baillie2011 5 159351203 ADRA1B no 612 612 DonorAR2
54 Baillie2011 13 79259801 na no 612 612 DonorAR2
54 Baillie2011 8 4452925 CSMD1 no 610 610 DonorAH
Arquivo B
study_id.x sample_name chromosome g_start
Baillie2011 DonorAH 8 4452925
Baillie2011 DonorBC 9 5491376
Baillie2011 DonorAH 8 5829283
Baillie2011 DonorCH 8 5829283
Resultado:
Arquivo A
individual_id study_id.x chromosome g_start gene referencel1hs SampleFile_num id sample_name
54 Baillie2011 4 57497067 na no 612 612 DonorAR2
54 Baillie2011 X 154790187 TMLHE no 612 612 DonorAR2
54 Baillie2011 5 159351203 ADRA1B no 612 612 DonorAR2
54 Baillie2011 13 79259801 na no 612 612 DonorAR2
Arquivo C
individual_id study_id.x chromosome g_start gene referencel1hs SampleFile_num id sample_name
54 Baillie2011 8 4452925 CSMD1 no 610 610 DonorAH