Processamento matemático no arquivo de texto

2

Eu tenho 200 arquivos de texto. Cada arquivo de texto contém uma coluna de números matemáticos (100k linhas).

Eu quero fazer algum processamento estatístico nesses dados (encontrar o probit ou quantile). Eu sei o valor médio e sigma associado a cada arquivo. Existe alguma maneira direta de calcular probit ou quantile de um conjunto de dados?

Se não, então eu sei a fórmula para o quantile que é = (data-média ordenada) / sigma. por exemplo,

arquivo_de_entrada.txt

12.2  
10.11  
15.55  
5.01  
...
...
12.9

temp.txt

5.01  
10.11  
12.2  
12.9  
15.55  
... 
...

O arquivo de saída final deve conter duas colunas. A primeira coluna é igual a temp_output.txt e a segunda coluna é a seguinte função matemática em cada elemento:

= (row(i)-mean)/sigma

Onde mean e sigma são dois números matemáticos, digamos 10.1 e 2.02, respectivamente. O arquivo de saída final deve ter esta aparência para os valores acima

output.txt

5.01 -2.51980198  
10.11 0.004950495  
12.2 1.03960396  
12.9 1.386138614  
15.55 2.698019802  
... 
...
    
por Nilesh 12.09.2014 / 07:18

1 resposta

2

você mencione algo assim

mybox $ cat file1.txt
12.2
10.11
15.55
5.01
mybox $ awk -v mean=10.2 -v sigma=2.02 '{printf "%f %f\n",$1,($1-mean)/sigma ; }' file1.txt
12.200000 0.990099
10.110000 -0.044554
15.550000 2.648515
5.010000 -2.569307

a parte críptica

awk -v mean=10.2 -v sigma=2.02 '{printf "%f %f\n",$1,($1-mean)/sigma ; }' file1.txt

como você pretende fornecer mean1, mean2, ... mean200?

    
por 12.09.2014 / 11:28