Eu tenho um arquivo grande com muitas seções como esta:
Bayes Empirical Bayes (BEB) analysis (Yang, Wong & Nielsen 2005. Mol.
Biol. Evol. 22:1107-1118)
Positively selected sites (*: P>95%; **: P>99%)
(amino acids refer to 1st sequence: 33134_Pseudomonas_10M)
Pr(w>1) post mean +- SE for w
271 A 0.911 1.524 +- 0.000
369 D 0.955* 1.467 +- 0.153
492 S 0.916 1.439 +- 0.203
The grid (...)
Eu preciso de um comando que diga algo como: se depois de "BEB" e antes de "A grade" existir um "*" ou "**" logo após um número, imprima a linha inteira e adicione o que vem depois "( Os aminoácidos referem-se à 1ª sequência: "e antes") "em uma nova coluna. Por exemplo:
369 D 0.955* 1.467 +- 0.153 33134_Pseudomonas_10M
nota: se houver duas linhas com "*" e / ou "**" na mesma seção, só preciso do texto adicionado uma vez. Exemplo:
369 D 0.955* 1.467 +- 0.153 33134_Pseudomonas_10M
378 R 0.987* 2.323 +- 0.254