Só para esclarecer um pouco. Espero que isso também responda às suas perguntas.
solicitação HTTP de tempo limite
É a hora do primeiro byte do cliente recebido, até o último byte enviado ao cliente (independentemente de manter-se ativo). Portanto, se o back-end estiver muito lento ou o cliente estiver enviando a solicitação muito lenta, toda a comunicação poderá demorar mais do que isso, e a solicitação será interrompida (e um tempo limite será enviado ao cliente).
tempo limite http-keep-alive
O tempo para manter uma conexão aberta entre o haproxy e o cliente (depois que a resposta do cliente é enviada). Isso não tem nada a ver com o tempo de resposta do back-end. Isso não tem nada a ver com o tamanho de uma única solicitação (por exemplo, tempo limite de solicitação http). Isso permite respostas mais rápidas se o usuário solicitar vários recursos (por exemplo, html, img e js). Com o keep alive, os pedidos únicos podem fazer uso da mesma conexão tcp. Dessa forma, o tempo de carregamento de uma página da Web completa é reduzido.
servidor de tempo limite
Este é o tempo limite para seus servidores de back-end. Quando atingido, o haproxy responde com 504 (tempo limite do gateway). Isso também não tem nada a ver com keep alive, já que é apenas sobre a conexão entre proxy e backend.