Invista seu tempo na instalação de uma solução de monitoramento. Todos os dados que você precisa para determinar o problema vão quase cair fora do ar, e o sistema irá ajudá-lo de inúmeras outras maneiras para solução de problemas, planejamento de capacidade, etc.
Designe um host em sua rede como seu servidor de monitoramento. Execute qualquer pacote de monitoramento, como Zenoss , Zabbix , Cactos ou muitos outros.
Monitore continuamente os tempos de ping do seu servidor de monitoramento para:
- Todas as máquinas clientes na sua rede (suas estações de trabalho de funcionários)
- O primeiro gateway e os servidores DNS do seu ISP
- Algum gateway perto do site com o qual você está preocupado (use o traceroute para determinar isso)
- O host real do site
Esses dados informam se há congestionamento na rede e você deve ser capaz de deduzir onde está. Não lhe dirá se os seus servidores web estão apenas atolados. Para isso, você precisará monitorar o tempo de resposta de URLs específicos. Você pode fazer isso com a maioria dos servidores de monitoramento também. Você pode ter um monitor do tempo de resposta de google.com como um caso de controle.
Uma vez que você esteja continuamente monitorando tudo isso, deixe-o rodar por uma semana e depois analise todos os gráficos. Você pode ver os tempos de resposta aumentar durante certas partes do dia. Você pode mostrar esses dados para o gerente de TI no site e dizer:
Here is a graph showing unacceptable response time from your web server, and here is another graph showing excellent response time from google during the same time period. Clearly our network and Internet connectivity is not to blame.