Hoje meu servidor Ubuntu 12.04 começou a bater uma vez por hora. Na verdade, é certo no minuto: 32, a cada hora. Parece ser uma falha real do kernel, ou seja, não há nada em / var / log / syslog, ele simplesmente pára. Eu até escrevi um roteiro que imprimia a hora a cada segundo para tentar descobrir a hora exata, e vi como o próximo acidente estava chegando, e o melhor que posso dizer é que é cerca de 32 minutos e 13 segundos depois da hora.
Mas eu não tenho trabalhos CRON em execução naquele momento, nada. Os que eu tenho são os mesmos scripts em Perl que eu tenho rodado há anos e que não fazem nada de especial. Eu não mudei nada no servidor em provavelmente semanas, e definitivamente nada importante. Eu passei por todas as fontes de tarefas agendadas que posso encontrar. Nada de especial acontece naquele momento, exceto que o servidor falha sem deixar vestígios do motivo.
Quando ele falha, eu não tenho escolha a não ser reiniciá-lo através do site da empresa de hospedagem, que tem sido a minha solução até agora, mas agora são quatro horas e eu tenho que dormir um pouco. Mas se eu fizer isso, meu site vai cair dentro de uma hora. Qualquer ajuda seria apreciada, a) como encontrar esta tarefa que está rodando e causando o travamento, se é o que é, ou b) como rastrear o que está acontecendo quando ele não aparece no syslog ou no dmesg.
RESOLVIDO . Entrei em contato com meu host. Aparentemente eles instalaram um novo software de monitoramento de servidores que sinalizou o meu como usando muita E / S de disco. Em vez de me dizer, este software deles simplesmente matou meu servidor. Corre a cada hora a: 32 minutos.