Instale linux-crashdump
, no mínimo, você obterá os buffers de criação de log do kernel um pouco antes da falha e todos os dados necessários para um profissional analisar o problema para determinar a causa raiz.
Um dos meus servidores falha uma vez em alguns dias.
Ele faz serviço web estático de baixo tráfego + serviço web dinâmico de baixo tráfego (PHP, MYSQL local com dados pequenos, APC, MEMCACHE) + alguns trabalhos em segundo plano, como processamento de arquivos XML.
A única pista que tenho é que algumas horas antes do servidor morrer, ele começa a trocar (veja a captura de tela link ) O servidor tem muito de memória livre.
Detalhes do servidor: Ubuntu 11.10 onarico i386 scalarizr (0.7.185) python 2.7.2, chef 0.10.8, mysql 5.1.58, apache 2.2.20, php 5.3.6, memcached 1.4.7 Amazon EC2 (usb west-1)
Como posso detectar o motivo da falha do servidor? Quando cai não é mais acessível do mundo exterior.
Instale linux-crashdump
, no mínimo, você obterá os buffers de criação de log do kernel um pouco antes da falha e todos os dados necessários para um profissional analisar o problema para determinar a causa raiz.