Manter ativo é feito para reduzir o número de configurações tcp, que são tagarelas e são strongmente influenciadas pela latência. Seu principal objetivo é melhorar o desempenho do cliente - assim como para um servidor moderno, há um baixo custo na configuração de conexões tcp.
Alguns proxies / balanceadores de carga desabilitam o keep-alive para os servidores web, porque eles assumem os servidores reais e estão em uma LAN com latência insignificante e, portanto, a penalidade de instalação tcp é insustentável. Também diminui a complexidade do software de balanceamento, já que não há necessariamente uma relação de um-para-um entre as conexões de entrada e saída (da perspectiva do LB).
Existem algumas razões pelas quais um servidor desativaria o keep-alive, então eu suspeito que ele seja provavelmente um erro. Uma exceção são os servidores a-filho por conexão (apache), em que a liberação desse filho / segmento o mais rápido possível oferece vantagens, mesmo se a experiência total do navegador (e o uso de largura de banda) ficarem menores.
Observe que o afaik keep-alive é um recurso opcional e nenhum serviço é necessário para implementá-lo.