Como depurar um servidor que falha uma vez em alguns dias?

2

Um dos meus servidores falha uma vez em alguns dias.

Ele faz serviço web estático de baixo tráfego + serviço web dinâmico de baixo tráfego (PHP, MYSQL local com dados pequenos, APC, MEMCACHE) + alguns trabalhos em segundo plano, como processamento de arquivos XML.

A única pista que tenho é que algumas horas antes do servidor morrer, ele começa a trocar (veja a captura de tela link ) O servidor tem muito de memória livre.

Detalhes do servidor: Ubuntu 11.10 onarico i386 scalarizr (0.7.185) python 2.7.2, chef 0.10.8, mysql 5.1.58, apache 2.2.20, php 5.3.6, memcached 1.4.7 Amazon EC2 (usb west-1)

Como posso detectar o motivo da falha do servidor? Quando cai não é mais acessível do mundo exterior.

    
por Nir 13.03.2012 / 14:22

1 resposta

2

Instale linux-crashdump , no mínimo, você obterá os buffers de criação de log do kernel um pouco antes da falha e todos os dados necessários para um profissional analisar o problema para determinar a causa raiz.

    
por ppetraki 13.03.2012 / 14:32