Contagem de frequência de números específicos em um arquivo de texto de notações científicas

1

Plano de fundo

Eu tenho um arquivo de texto chamado blood_conc.txt como mostrado:

  0, 0, 0, 0, 0, 0, 0, 1.32006590271e-05, 1.990014992001e-05, 1.504668143682e-05, 2.176900659261e-06,
    7.673488970859e-06, 2.169217049562e-05, 4.343183585883e-05, 0, 0, 0, 0, 0, 0, 0,
    2.143804950099e-05, 0, 0, 1.849919603625e-06, 0, 0, 0, 0, 0, 0, 0, 4.123812986073e-07, 0,
    0, 0, 0, 0, 0, 0, 0, 0, 0.0001365177, 7.81009e-06, 2.695291e-07, 0, 0, 0,
    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
    0, 0,
  0, 0, 0, 0, 0, 0, 0, 2.1799e-05, 1.82574e-05, 1.68109e-05, 2.722782e-05,
    5.355517e-05, 8.196468e-05, 7.177729e-05, 7.863765e-05, 5.774439e-05,
    1.329413e-08, 0, 0, 0, 4.320018e-06, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
    0.0003335425, 0, 0, 0, 0, 0, 0, 0, 0, 6.061237e-05, 6.36887e-05,
    2.250928e-05, 0, 0, 7.327124e-07, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,

Gostaria de contar o número de 0 entre a linha 3 e a linha 8, inclusive. ou seja,

2.143804950099e-05, 0, 0, 1.849919603625e-06, 0, 0, 0, 0, 0, 0, 0, 4.123812986073e-07, 0,
    0, 0, 0, 0, 0, 0, 0, 0, 0.0001365177, 7.81009e-06, 2.695291e-07, 0, 0, 0,
    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
    0, 0,
  0, 0, 0, 0, 0, 0, 0, 2.1799e-05, 1.82574e-05, 1.68109e-05, 2.722782e-05,
    5.355517e-05, 8.196468e-05, 7.177729e-05, 7.863765e-05, 5.774439e-05,

e a frequência de 0 deve ser 54.

Eu quero uma linha de comando simples para concluir duas tarefas:

Tarefa 1 : Conte o número de 0 no texto da Linha 3 para a Linha 8.

Tarefa 2 : conta o número de valores situados entre o intervalo, diz (2.452555e-05, 0.0032784).

Meu pensamento

Eu fiz algumas pesquisas nas webs e posts. Eu acho que awk e grep -c podem ajudar.

Para focar o intervalo de linhas, acho que posso usar awk 'NR==3, NR==8' blood_conc.txt .

No entanto, não sei como proceder usando grep ou perl . Eu quero uma linha de comando simples que apenas me retorna a frequência.

    
por nam 10.06.2015 / 17:18

2 respostas

1

Você pode tentar isso com awk :

awk -F"," 'NR == 3, NR == 8 { for (i = 1; i <= NF; i++) { if ($i == 0) { cnt++; } if ($i >= 2.452555e-05 && $i <= 0.0032784) { cnt1++; } } } END { print cnt, cnt1; }' file
    
por 10.06.2015 / 17:54
1

Seu ponto de partida é bom; agora você tem que iterar sobre os campos, onde uma pré-condição é definir um separador de campo apropriado. Para contar os zeros:

awk '
  BEGIN { FS="[, ]+" }
  NR==3, NR==8 { for (i=1; i<=NF; i++) if ($i==0) c++ }
  END { print c }
'

Para verificar um intervalo, altere a condição if de acordo, algo como: if ($i >= ... && $i <= ...) .

    
por 10.06.2015 / 17:52