awk não reconhecendo números exponenciais corretamente - meu erro? [fechadas]

0

versão do awk: GNU Awk 4.1.1, API: 1.1 (GNU MPFR 3.1.2-p3, GNU MP 6.0.0)

Eu tenho a seguinte entrada (pequeno exemplo):

Lh8627_00055___transposase_3    c368296268f9d0100b8a65d2cd57aaf2    424 Pfam    PF01610 Transposase 297 404 1.8E-11 T   22-06-2017  IPR002560   Transposase IS204/IS1001/IS1096/IS1165, DDE domain      
Lh8627_05835___transposase_1    212014f87f94178312dac70f061d81c6    469 Pfam    PF06782 Uncharacterised protein family (UPF0236)    30  399 4.5E-37 T   22-06-2017  IPR009620   Uncharacterised protein family UPF0236      
Lh8627_03700___transposase_3    916962acc8271c66b217ab903d836768    401 Pfam    PF06782 Uncharacterised protein family (UPF0236)    201 334 4.4E-6  T   22-06-2017  IPR009620   Uncharacterised protein family UPF0236      
Lh8627_01850___transposase_1    05e46b0f13cf6aa7db8adcf5fd3fd39d    409 Pfam    PF01548 Transposase 8   160 3.0E-29 T   22-06-2017  IPR002525   Transposase, IS111A/IS1328/IS1533, N-terminal   GO:0003677|GO:0004803|GO:0006313    

Eu gostaria de filtrar as linhas que possuem na 9ª coluna um valor menor que 1.0E-10

Meu comando é awk '$9 < 1.0E-10' my file . Mas não está filtrando a terceira linha na pequena entrada acima por exemplo. O que estou fazendo errado?

    
por Michael 23.06.2017 / 09:46

2 respostas

1

Meu problema é que eu não entendi que o awk também usa espaço como delimitador e não apenas como aba. Depois de adicionar -F'\t' , funciona. A comparação de números foi boa.

    
por 23.06.2017 / 10:17
0

Seu comando é bom. No entanto, sua entrada não é: o nono membro em seu exemplo nem sempre é o esperado:

$ awk '{print $9}' <your_file>
1.8E-11
(UPF0236)
(UPF0236)
3.0E-29

Você poderia, por exemplo, reorganizar sua entrada removendo elementos indesejados usando sed :

sed 's/protein family (UPF0236)//' <your_file> | awk '$9 < 1.0E-10'
    
por 23.06.2017 / 10:05

Tags