A documentação aqui tem uma explicação que parece com o que você quer saber:
The directive specifies the zone (zone) and the maximum possible bursts of requests (burst). If the rate exceeds the demands outlined in the zone, the request is delayed, so that queries are processed at a given speed
Pelo que entendi, as solicitações sobre o burst serão atrasadas (leve mais tempo e espere até que elas possam ser atendidas), com as opções nodelay
o atraso não é usado e solicitações em excesso são negadas com um erro 503. / p>
Esta postagem do blog ( archive.org ) dá uma boa explicação de como a limitação de taxa funciona nginx:
If you’re like me, you’re probably wondering what the heck burst really means. Here is the trick: replace the word ‘burst’ with ‘bucket’, and assume that every user is given a bucket with 5 tokens. Every time that they exceed the rate of 1 request per second, they have to pay a token. Once they’ve spent all of their tokens, they are given an HTTP 503 error message, which has essentially become the standard for ‘back off, man!’.