Essa diferença remonta ao Berkeley Unix original e decorre do fato de que o kernel não pode manter uma média móvel; precisaria reter um grande número de leituras anteriores para fazê-lo, e especialmente nos velhos tempos simplesmente não havia memória de sobra para isso. O algoritmo usado em seu lugar tem a vantagem de que tudo que o kernel precisa manter é o resultado do cálculo anterior.
Tenha em mente que o algoritmo estava um pouco mais próximo da verdade quando as velocidades do computador e os ciclos de relógio correspondentes eram medidos em dezenas de MHz em vez de GHz; há muito mais tempo para as discrepâncias se infiltrarem nesses dias.