Existem várias coisas que desempenham um papel aqui. Veja as etapas aproximadas quando um balanceador de carga é usado
- Pesquisa de DNS para o balanceador de carga
- Conecte o tempo ao balanceador de carga. Se isso é https, geralmente são algumas viagens de ida e volta, então a latência desempenha um papel
- Tempo de processamento do balanceador de carga
- Tempo de procura de DNS do balanceador de carga para o servidor (provavelmente armazenado em cache)
- LB abre uma conexão com o servidor (possivelmente reutilizando uma conexão existente)
- LB transmite a solicitação para o servidor
- LB espera que o servidor processe a solicitação
- LB recebe a resposta
- LB Envie a resposta de volta ao cliente
Aqui estão os passos sem o balanceador de carga
- Conecte-se ao servidor. Se isso é https, geralmente são algumas viagens de ida e volta, então a latência desempenha um papel
- Transmitir a solicitação para o servidor
- Aguarde até que o servidor processe a solicitação
- Receba a resposta
São 9 etapas em vez de 4, uma diferença significativa.
Você pode comparar os dois usando o Teste de página da Web , que fornecerá muito mais informações. Faça os testes, se precisar de ajuda para interpretar os resultados, edite sua postagem e marque qualquer pessoa que queira ver em um comentário.
Como Rowan aponta abaixo, a latência é pelo menos tão importante quanto a largura de banda. A latência no data center é muito baixa, quase insignificante, mas cada viagem de ida e volta ao servidor leva tempo. O TLS 1.3 ajuda com isso e o uso de uma Content Distribution Network (CDN) que coloca o conteúdo mais próximo do usuário também ajuda em muitos casos.