website no ubuntu repentinamente rodando devagar

1

O site que administro de repente começou a funcionar lentamente hoje. Estou tentando descobrir onde está o gargalo. Eu criei um arquivo de texto de 14kb e isso leva 5 segundos para abrir no navegador! Estou confiante de que o problema não é com a minha conexão com a internet - eu posso assistir ao youtube muito bem, por exemplo.

Se eu acessar o arquivo de 14kb no lan, a página leva 6ms para abrir. Isso me faz pensar que o problema não é o apache.

No entanto, o site também usa o mysql e, quando eu abro uma página que exibe dados em uma tabela, ela leva muito tempo - como 10 minutos ou mais. Na lan isso se abre imediatamente. Verifico a lista de processos completa enquanto a página está sendo carregada pela Internet e há consultas que estão demorando muito tempo:

mysql> show full processlist;
+------+------+-----------+------+---------+------+-------+-----------------------+
| Id   | User | Host      | db   | Command | Time | State | Info                  |
+------+------+-----------+------+---------+------+-------+-----------------------+
| xxxx | root | localhost | fms  | Sleep   |  307 |       | NULL                  | 
| yyyy | root | localhost | NULL | Query   |    0 | NULL  | show full processlist | 
+------+------+-----------+------+---------+------+-------+-----------------------+
2 rows in set (0.00 sec)

Alguém pode me ajudar a diagnosticar esse problema? Eu tenho acesso root completo para a máquina Ubuntu executando o servidor web. O site é gerado a partir do apache e php.

mais informações

Eu já estive em casa e voltei a trabalhar. Estranhamente, o site funciona bem da minha casa! então aqui está o status atual:

  • em casa: funciona bem
  • no trabalho na lan2 (lan diferente para o servidor): miseravelmente lento
  • no trabalho na lan1 (mesma lan do servidor): funciona bem

é possível que o problema esteja no dns no trabalho lan2. talvez o isp esteja fazendo cache ou filtrando as solicitações?

seguindo o traceroute lead ...

  • no lan1 de trabalho, há apenas um salto
  • no trabalho lan2, traceroute usando icmp echos (pings) não foi concluído em 60 saltos (entradas de 9 a 60 são todos * * *), mas o traceroute usando pacotes tcp syn foi concluído em 12 saltos
  • O
  • traceroute da minha casa também não passou usando o icmp echos, mas foi concluído em 9 hops usando pacotes tcp syn.

parece que o problema está completamente confinado a lan2 - o que indica que há algum problema de configuração (por exemplo, uma entrada de DNS ruim que foi armazenada em cache apenas para este site, ou talvez algum roteamento que está ficando preso em um loop) ou então algum pedaço de hardware morreu. todas as sugestões sobre como depurar este problema são bem-vindas.

informações adicionais da wireshark

Eu notei que as páginas são relativamente rápidas de se conectar, mas demoram para terminar o carregamento. Eu também corri wireshark ao abrir a página e encontrei muitos (centenas) dos seguintes pacotes:

source           dest              protocol  info
website          work pc on lan2   TCP       [TCP Retransmission] [TCP segment of a reassembled PDU]
work pc on lan2  website           TCP       62783 > https [ACK] Seq=667 Ack=26435 Win=260 Len=0
website          work pc on lan2   TCP       [TCP Previous segment not captured] [TCP segment of a reassembled PDU]
work pc on lan2  website           TCP       [TCP Dup ACK 192#1] 62783 > https [ACK] Seq=667 Ack=26435 Win=260 Len=0 SLE=xxxxx SRE=xxxxx
website          work pc on lan2   TCP       [TCP segment of a reassembled PDU]

Eu estou querendo saber se o problema está com o certificado SSL armazenado em cache na lan2? realmente agarrando-me a canudinhos agora ... vou procurar no google alguns dos termos da informação do wireshark e talvez isso leve a algum lugar.

    
por mulllhausen 06.08.2013 / 11:00

2 respostas

0

eu encontrei um windows pc que estava conectado a ambos os lans no trabalho. o usuário acessa principalmente o site discutido na questão, então eu desconectei este pc da lan2 para que ele pudesse se comunicar diretamente com o site na lan1. uma vez que eu fiz isso, todos os outros PCs trabalhando na lan2 começaram a funcionar bem para o site - a conexão e o carregamento agora estão de volta às velocidades rápidas usuais. Meu palpite é que este PC estava roteando metade dos pacotes do site, enquanto o restante via Internet, e talvez eles não estivessem sendo remontados novamente no navegador.

Eu não tenho certeza se esse é o caso, mas tenho certeza que o problema foi corrigido quando eu desconectei este pc da lan2.

obviamente, não havia como adivinhar a resposta dada a informação que eu publiquei, mas graças a todos que deram sugestões.

    
por 07.08.2013 / 07:25
1

Como o traceroute não está sendo concluído em LAN2, pode ser uma falha de hardware. Verifique se há falhas no cabo, roteador / interruptores cujas luzes de serviço estão piscando, substitua-as.

    
por 06.08.2013 / 14:11