Para responder diretamente à sua pergunta, dê uma olhada em ModEvasive e Traffic Shaping do Lighttpd.
Como alternativa / além do que você mencionou, você deve ser capaz de controlar as conexões por segundo usando as regras do iptables.
E, finalmente, considere o uso de algum tipo de mecanismo de fila de aplicativo (mensagem). Dessa forma, independentemente de quantos pedidos você chegar ao seu endpoint da interface web / api, a fila garantirá que apenas o número desejado de tarefas nltk paralelas será executado ao mesmo tempo.