A média de carga é computada no kernel - veja para detalhes. Então, você não pode simplesmente obter uma leitura com uma resolução melhor. Em vez disso, você poderia escrever o código do espaço do usuário que duplica a funcionalidade, mas isso parece um pouco complicado (até porque, para fazer isso direito, você teria que testar muito, o que servidor sobrecarregado).
Em vez disso, sugiro escolher algo diferente da média de carga para basear sua decisão - possivelmente algo que você conhece do seu próprio serviço. Por exemplo, que tal recuar se os tempos de resposta ultrapassarem um limiar mediano?