Recuperar seletivamente porções de um arquivo grande se uma condição for atendida

0

Eu tenho um arquivo grande com muitas seções como esta:

  Bayes Empirical Bayes (BEB) analysis (Yang, Wong & Nielsen 2005. Mol.
  Biol. Evol. 22:1107-1118)
  Positively selected sites (*: P>95%; **: P>99%)
  (amino acids refer to 1st sequence: 33134_Pseudomonas_10M)

                     Pr(w>1)     post mean +- SE for w

          271 A      0.911         1.524 +- 0.000
          369 D      0.955*        1.467 +- 0.153
          492 S      0.916         1.439 +- 0.203



         The grid (...)

Eu preciso de um comando que diga algo como: se depois de "BEB" e antes de "A grade" existir um "*" ou "**" logo após um número, imprima a linha inteira e adicione o que vem depois "( Os aminoácidos referem-se à 1ª sequência: "e antes") "em uma nova coluna. Por exemplo:

  369 D      0.955*        1.467 +- 0.153        33134_Pseudomonas_10M

nota: se houver duas linhas com "*" e / ou "**" na mesma seção, só preciso do texto adicionado uma vez. Exemplo:

  369 D      0.955*        1.467 +- 0.153        33134_Pseudomonas_10M
  378 R      0.987*        2.323 +- 0.254
    
por Manuel 22.11.2018 / 00:07

0 respostas