Quantas solicitações / s e total de conexões o seu verniz manipula quando ocorrem os erros 503?
Eu me deparei com uma situação semelhante em que ele retornaria 503 erros para os usuários enquanto os backends estavam rodando muito bem.
vernizlog mostraria que os backends estavam doentes quando de fato estavam saudáveis.
Então, após algumas pesquisas, descobri que o problema estava nos descritores de arquivos máximos.
Eu tive que aumentar os descritores de arquivos máximos do meu sistema para que o verniz pudesse lidar com todas as solicitações corretamente.
Depois disso, todos os 503 erros pararam e todos os backends mostram-se constantemente saudáveis.