Não parece razoável acreditar que o ALB mantém conexões de back-end abertas indefinidamente, mas que o tempo limite configurável só se aplica a conexões front-end.
Estou um pouco preocupado com a quantidade de tempo decorrido entre a chegada e o ACK da solicitação em: 32.042 e o fechamento do fd em: 32.066. Você está planejando uma conexão que, na verdade, não está ociosa - ela aceitou uma solicitação 24ms antes. (!?) Para mim, é um tempo surpreendentemente "longo".
Conforme observado na mesma página nos documentos,
Classic Load Balancers use pre-open connections but Application Load Balancers do not.
Você não precisa se preocupar com vazamento de descritores, pois o ALB não abrirá conexões que ele realmente não precisa para solicitações de serviço ... mas você também não precisará de um tempo limite infinito.
A questão parece ser por quanto tempo o ALB mantém conexões de back-end ociosas abertas - o que parece ser não documentado, mas vou revisar meus logs e ver se consigo encontrar evidências para sugerir o que o timer pode ser definido, supondo que seja estático. (É claro que manter conexões de back-end abertas é uma otimização de desempenho.)
A intuição sugere que você pode tentar um temporizador de 75 segundos ao seu lado. Esses são os padrões estabelecidos com base no comportamento clássico do balanceador e não observei nenhum problema com ALBs colocados em seu lugar.