Investigando porque o servidor ficou sem resposta

1

Estou executando um servidor virtual privado (Debian / Linux executando apache + tomcat + jruby) e, de tempos em tempos, ele fica inacessível (nem sequer consigo fazer ping dele). Eu culpo isso em nosso provedor de serviços. Quando isso acontece, o servidor precisa ser reinicializado através do console de gerenciamento do provedor e tudo volta ao normal. Eu tentei percorrer os logs no var / log, mas não encontrei nada de extraordinário lá. Quais são os próximos passos na investigação de tais incidentes?

    
por Honza 02.02.2011 / 10:48

2 respostas

1

Poderia ter sido útil se você tivesse mencionado o que estava procurando nos registros e não encontrou.

Provavelmente não há muita coisa que você possa fazer aqui. Mas você pode tentar configurar um watchdog interno básico - usando o cron (ou, de preferência, um daemon) para disparar e registrar eventos em intervalos curtos e regulares - e então verificar se ele continua funcionando até a reinicialização.

E aumente o log.

Presumivelmente, você está pagando ao provedor de serviços - você deve pedir a eles que forneçam detalhes de sua investigação

    
por 02.02.2011 / 10:55
1

Estas são as primeiras perguntas que gostaria de responder para resolver o problema:

  • No momento em que o servidor ficou sem resposta, ele conseguiu enviar os pacotes de ping de saída?
  • Como a configuração da rede parece no momento da falha?
  • Existe um firewall em execução no servidor? Qual é o estado no momento da falha?

Você tem um KVM que você poderia usar para tentar estabelecer uma sessão de console remota? Em qualquer caso, você vai querer ver o que está acontecendo em dentro do servidor no momento da falha.

Quando os logs não indicam erros e quando você não tem a capacidade de estabelecer uma configuração de console remoto, você pode optar por uma entrada cron que regularmente ecomiza a saída de suas configurações de rede / firewall para um arquivo que você verifique mais tarde.

    
por 02.02.2011 / 10:56

Tags