Mesclando dois arquivos no unix, com uma coluna comum que é redundante

0

Eu tenho dois arquivos com uma coluna comum que é redundante. O arquivo 1 tem locais cromossômicos e TFs, o arquivo 2 tem locais cromossômicos e números de Refseq.

Arquivo 1:
chr1: 66997824-67000456 ZNF333
chr1: 66997824-67000456 EGR1
chr1: 66997824-67000456 MZF-1
chr22: 51221989-51222166 Zic2
chr22: 51221989-51222166 ZF5

Arquivo 2:
chr1: 66997824-67000456 Refseq # 1
chr22: 51221989-51222166 Refseq # 22

Gostaria de mesclar esses dois arquivos e criar um novo arquivo com três colunas.
chr1: 66997824-67000456 ZNF333 Refseq # 1
chr1: 66997824-67000456 EGR1 Refseq # 1
chr1: 66997824-67000456 MZF-1 Refseq # 1
chr22: 51221989-51222166 Zic2 Refseq # 22
chr22: 51221989-51222166 ZF5 Refseq # 22

Como os locais dos cromossomos são redundantes, não consegui mesclá-los usando o join no Unix - Existe uma maneira de mesclar usando sed ou awk?

    
por ABB 31.10.2015 / 15:41

1 resposta

1

join file1 file2

Saída:

chr1:66997824-67000456 ZNF333 Refseq#1
chr1:66997824-67000456 EGR1 Refseq#1
chr1:66997824-67000456 MZF-1 Refseq#1
chr22:51221989-51222166 Zic2 Refseq#22
chr22:51221989-51222166 ZF5 Refseq#22

ou

join file1 file2 | awk '{OFS="     ";print $1,$2,$3}'

Saída:

chr1:66997824-67000456     ZNF333     Refseq#1
chr1:66997824-67000456     EGR1     Refseq#1
chr1:66997824-67000456     MZF-1     Refseq#1
chr22:51221989-51222166     Zic2     Refseq#22
chr22:51221989-51222166     ZF5     Refseq#22
    
por 31.10.2015 / 17:11

Tags