A taxa determina a rapidez com que as solicitações são processadas. Se você definir a taxa para 120r / m, isso significa que 1 solicitação será processada a cada 0,5 segundo.
Se você receber 5 solicitações de uma só vez, isso não significa que todas elas passarão. Eles serão enfileirados (até o tamanho da sua explosão) e processados sequencialmente, 1 a cada 0,5 segundo.
Você está recebendo esse aviso porque as coisas estão entrando na fila e ficando atrasadas. Isso não significa que eles estão sendo rejeitados.
Se você não quiser que as coisas fiquem atrasadas, use o parâmetro nodelay:
location "/api" {
limit_req zone=nocachelimit burst=20 nodelay;
}
Para mais detalhes sobre como isso funciona, consulte o link