Primeiro, observe que a coluna 2 nos exemplos não é a média sample para os dados nos arquivos. Se é a média correta para a distribuição true , o desvio padrão é:
$ awk '{ssq+=($1 - $2)**2} END { print sqrt(ssq / NR); }' file1a
61.4138
Aqui, a variável ssq
é a soma dos quadrados dos desvios da média verdadeira.
O programa acima implementa a fórmula para o desvio padrão:
onde mu ( μ ) é a média true .
Terminologia
O que eu estou me referindo como a média true é às vezes chamada de população , significando a média que seria computada se alguém teoricamente tivesse toda a população, não apenas alguma amostra dessa população.