Coloque os genes que você deseja combinar em um arquivo, um por linha. Então é apenas uma chamada grep:
grep -Fwf genes.txt Book3.txt
Para preservar o cabeçalho:
{ head -n1 Book3.txt; grep -Fwf genes.txt Book3.txt; }
opções do grep:
-
-F
"strings fixas" - desabilita expressões regulares, procura apenas por correspondências de substring -
-w
"correspondências de palavras" - procure apenas correspondências que sejam palavras inteiras -
-f file
- especifica arquivos contendo padrões (um por linha)
Com seus dados de amostra
$ cat genes.txt
C2
CDK11A
IL3
$ { head -n1 Book3.txt; grep -Fwf genes.txt Book3.txt; }
Chr Start End Ref Alt Func.refGene Gene.refGene ExonicFunc.refGene AAChange.refGene Func.knownGene Gene.knownGene
1 53387380 53387380 G C UTR5 C2(hhh) NA NA UTR5 C2(FFF)
1 1647814 1647814 T C exonic CDK11A,CDK11B synonymous SNV NA exonic CDK11A,CDK11B
1 7069620 7069620 T C intronic PTPN6(ggg),IL3 NA NA intronic PTPN6(ggg),IL3