Eu tenho um convidado do Debian 6 Xen que parece ir dormir de tempos em tempos. Aleatoriamente, ele simplesmente pára para responder a qualquer requisição de rede (HTTP, ssh, ping) e só retoma a atividade quando nós logarmos no console. O servidor claramente não está travado, no entanto, durante este tempo dormir nenhuma atividade acontece, até mesmo todos os logs (syslogd e klogd) permanecem em branco durante este tempo.
Dependendo de quando isso acontece e quando realmente podemos fazer logon no console, alguns minutos, mas às vezes até uma hora, podem ser gastos nesse modo. Esse comportamento acontece de forma irregular, cerca de uma vez por mês, aleatoriamente.
Eu não tenho acesso ao console nem ao host Xen, mas a equipe de suporte da empresa de hospedagem está dizendo que nada de suspeito é mostrado. Eles dizem que é o único convidado em sua infraestrutura exibindo esse comportamento.
O convidado executa um kernel Linux 2.6.29.6 compilado pela empresa de hospedagem, possui 2 núcleos, 4 GB de RAM e 2 GB de swap. A carga média de 5 minutos não é baixa (entre 2 e 3, com picos até 5), mas a atividade de troca é baixa (swapin / swapout) e o espaço de troca é pouco usado. Nenhuma mensagem do kernel é localizada nos logs, nem na saída do dmesg.
Este servidor está executando o regular apache + mod_php e proftpd, realmente nada extravagante. AFAICT não alteramos nenhum parâmetro relacionado ao clock do kernel (no entanto, não tenho certeza de como posso verificar a configuração do kernel se um modo de economia de energia ou um passo de relógio estiver ativado ou não).
Estamos ficando sem pistas de onde vem o problema.
Edit: Eu executei find /var -mmin -beforeevent -mmin +afterevent
para tentar encontrar qualquer arquivo sendo modificado durante a última vez em que o servidor foi interrompido e tudo o que encontrar relatado foi o arquivo sendo modificado logo antes ou logo após o evento , mas nada no meio, mesmo quando foi um tempo de 1 hora. Este servidor tem apenas uma única partição, então não é como se apenas o disco contendo / var estivesse inativo.
Eu também tenho outros hosts na mesma sub-rede e todos vêem este servidor como offline: snmp polling falha e nenhuma requisição é registrada no host DB a partir de qualquer aplicativo PHP em execução no servidor sleeping .
Também tentamos configurar alguns cronjob para fazer atividades contínuas (como ping de algum outro host continuamente), isso não impediu que este servidor entrasse nesse modo sleep .