O site que administro de repente começou a funcionar lentamente hoje. Estou tentando descobrir onde está o gargalo. Eu criei um arquivo de texto de 14kb e isso leva 5 segundos para abrir no navegador! Estou confiante de que o problema não é com a minha conexão com a internet - eu posso assistir ao youtube muito bem, por exemplo.
Se eu acessar o arquivo de 14kb no lan, a página leva 6ms para abrir. Isso me faz pensar que o problema não é o apache.
No entanto, o site também usa o mysql e, quando eu abro uma página que exibe dados em uma tabela, ela leva muito tempo - como 10 minutos ou mais. Na lan isso se abre imediatamente. Verifico a lista de processos completa enquanto a página está sendo carregada pela Internet e há consultas que estão demorando muito tempo:
mysql> show full processlist;
+------+------+-----------+------+---------+------+-------+-----------------------+
| Id | User | Host | db | Command | Time | State | Info |
+------+------+-----------+------+---------+------+-------+-----------------------+
| xxxx | root | localhost | fms | Sleep | 307 | | NULL |
| yyyy | root | localhost | NULL | Query | 0 | NULL | show full processlist |
+------+------+-----------+------+---------+------+-------+-----------------------+
2 rows in set (0.00 sec)
Alguém pode me ajudar a diagnosticar esse problema? Eu tenho acesso root completo para a máquina Ubuntu executando o servidor web. O site é gerado a partir do apache e php.
mais informações
Eu já estive em casa e voltei a trabalhar. Estranhamente, o site funciona bem da minha casa! então aqui está o status atual:
- em casa: funciona bem
- no trabalho na lan2 (lan diferente para o servidor): miseravelmente lento
- no trabalho na lan1 (mesma lan do servidor): funciona bem
é possível que o problema esteja no dns no trabalho lan2. talvez o isp esteja fazendo cache ou filtrando as solicitações?
seguindo o traceroute lead ...
- no lan1 de trabalho, há apenas um salto
- no trabalho lan2, traceroute usando icmp echos (pings) não foi concluído em 60 saltos (entradas de 9 a 60 são todos * * *), mas o traceroute usando pacotes tcp syn foi concluído em 12 saltos
O - traceroute da minha casa também não passou usando o icmp echos, mas foi concluído em 9 hops usando pacotes tcp syn.
parece que o problema está completamente confinado a lan2 - o que indica que há algum problema de configuração (por exemplo, uma entrada de DNS ruim que foi armazenada em cache apenas para este site, ou talvez algum roteamento que está ficando preso em um loop) ou então algum pedaço de hardware morreu. todas as sugestões sobre como depurar este problema são bem-vindas.
informações adicionais da wireshark
Eu notei que as páginas são relativamente rápidas de se conectar, mas demoram para terminar o carregamento. Eu também corri wireshark ao abrir a página e encontrei muitos (centenas) dos seguintes pacotes:
source dest protocol info
website work pc on lan2 TCP [TCP Retransmission] [TCP segment of a reassembled PDU]
work pc on lan2 website TCP 62783 > https [ACK] Seq=667 Ack=26435 Win=260 Len=0
website work pc on lan2 TCP [TCP Previous segment not captured] [TCP segment of a reassembled PDU]
work pc on lan2 website TCP [TCP Dup ACK 192#1] 62783 > https [ACK] Seq=667 Ack=26435 Win=260 Len=0 SLE=xxxxx SRE=xxxxx
website work pc on lan2 TCP [TCP segment of a reassembled PDU]
Eu estou querendo saber se o problema está com o certificado SSL armazenado em cache na lan2? realmente agarrando-me a canudinhos agora ... vou procurar no google alguns dos termos da informação do wireshark e talvez isso leve a algum lugar.