Como grep seqüência de fasta usando lista de IDs em outro arquivo?

0

Eu tenho um grande arquivo de sequência rápida e uma lista de IDs. Eu preciso de grep algumas seqüências com cabeçalho usando seus IDs de outro arquivo. Aqui estão os exemplos dos arquivos.

Arquivo 1:

>AB1234
ACGTAGATA
>AB3456
ACGATAGAT
>AB4567
ACGTGTGA

Arquivo 2

>AB1234
>AB3456
    
por Manoj Kumar 14.11.2017 / 18:59

2 respostas

1

Você pode ter grep de padrões de leitura de um arquivo, um padrão por linha, com a opção -f :

grep -x -F -A 1 -f 'File 2' 'File 1'

Além disso,

  • -F interpreta os padrões literalmente e não como expressões regulares,

  • -x corresponde apenas a linhas inteiras,

  • -A N imprime N linhas após cada correspondência.

por David Foerster 16.11.2017 / 18:53
0

Eu tenho isso para trabalhar:

for i in $(cut -d" " -f1- file2); do grep -o "$i" file1 | tee -a result.txt; done

Suposição file1 == id file e file2 == arquivo a ser greped

Result.txt:

AB1234
AB3456
    
por George Udosen 14.11.2017 / 19:15