Remove todo o texto que não inicia com (EC usando o comando sed awk grep

Question

Remove todo o texto que não inicia com (EC usando o comando sed awk grep

#1 resposta do (1 votos)
#2 resposta do (1 votos)

0

Eu tenho um arquivo como este e quero ter apenas números de EC do arquivo.

5'-nucleotidase SurE (EC 3.1.3.5)
L-aspartate oxidase (EC 1.4.3.16)
Nicotinamide-nucleotide adenylyltransferase, NadM family (EC 2.7.7.1) @ Nicotinate-nucleotide adenylyltransferase, NadM family (EC 2.7.7.18)
Nicotinamidase (EC 3.5.1.19)
Quinolinate phosphoribosyltransferase [decarboxylating] 
NAD synthetase (EC 6.3.1.5) / Glutamine amidotransferase chain of NAD synthetase
4'-phosphopantetheinyl transferase (EC 2.7.8.-)

A saída deve ser como:

(EC 3.1.3.5)
(EC 1.4.3.16)
(EC 2.7.7.1)
(EC 2.7.7.18)
(EC 3.5.1.19)    
(EC 6.3.1.5)    
(EC 2.7.8.-)

grep awk sed

por Tina sharma 02.12.2017 / 12:39

2 respostas

Tags grep awk sed

O último comando em um loop é bem-sucedido, mas o status de saída é 1 Qual número de 1 até 64 é o número do sinal do debug?

score 1 · Answer 1

Simplesmente com grep :

grep -o '(EC [^)]*)' file

[^)]* - corresponde a todos os caracteres, exceto colchete de fechamento )

A saída:

(EC 3.1.3.5)
(EC 1.4.3.16)
(EC 2.7.7.1)
(EC 2.7.7.18)
(EC 3.5.1.19)
(EC 6.3.1.5)
(EC 2.7.8.-)

score 1 · Answer 2

sed -n 's/^\(.*\)\((EC[^)]*)\).*$//p'

e a versão divertida awk :

awk -F'\(EC|\)' 'NF==3 { print "(EC" $2 ")" }'