Infelizmente, você parece estar confundindo conexões com sessões em nível de aplicativo. Um usuário que visita o site pode ter um cookie que faz você pensar que ele possui uma conexão, embora não seja necessariamente o caso. Ele pode abrir quantas conexões forem necessárias para buscar objetos e navegar pelas páginas.
Os 90 segundos que você está observando com certeza é o tempo de espera do navegador para conexões inativas.
É possível conseguir o que você quer, mas é um pouco mais complexo do que isso, pois você também deve considerar a presença do cookie de persistência na solicitação para descobrir se o visitante é novo ou não.
Além disso, em geral, é mais eficiente confiar na média da contagem de conexões por servidor do que na contagem de conexões front-end. A razão é que quando um servidor morre, você precisa reajustar esse número. A maneira mais eficiente de fazer isso é configurar um valor maxconn de servidor para habilitar o enfileiramento e usar avg_queue para que o limite se aplique ao número médio de solicitações enfileiradas nos servidores. Isso permite que você gerencie corretamente os visitantes conhecidos enquanto move suavemente novos usuários para outro back-end quando a carga aumenta devido a visitantes existentes.