Também debatemos isso ao colocar nossa camada de cache de backend, também estamos usando o nginx, mas com o squid e uma JVM que serve conteúdo.
Se você não estiver usando nenhuma funcionalidade exclusiva do nginx que você possa alternar, já construímos alguns módulos nginx.
Você deve considerar qual a sobrecarga real dessa configuração de conexão em relação à solicitação de ponta a ponta. Para nós, quando testamos, sempre foi necessário ler < 2ms até mesmo um recurso do cache de memória para responder (> 5ms).