No último mês, percebi que nosso Dell PowerEdge T630 O servidor ( Ubuntu 14.04.3 LTS ) está sendo reinicializado inesperadamente (29 de janeiro foram reinicializações manuais):
$cat /var/log/wtmp.report | grep boot | grep -v 'Jan 29'
reboot system boot 3.13.0-77-generi Wed Feb 10 09:00 - 13:59 (04:58)
reboot system boot 3.13.0-76-generi Wed Jan 27 09:01 - 10:47 (2+01:45)
reboot system boot 3.13.0-74-generi Tue Jan 19 10:34 - 10:47 (10+00:13)
reboot system boot 3.13.0-74-generi Wed Jan 13 09:02 - 10:47 (16+01:45)
Assim, de todas as reinicializações não especificadas, todas ( com exceção de 19 de janeiro ) parecem ocorrer a cada quarta-feira às 9:00 (UTC-6).
Eu examinei todos os suspeitos usuais ( /var/log/kern.log
, /var/log/auth.log
, /var/log/dmesg
, /var/log/syslog
, etc), mas não consigo encontrar nenhum tipo de razão para a reinicialização.
Estou executando Fail2ban no servidor; sempre que eu faço uma reinicialização manual, recebo um e-mail automático do Fail2ban dizendo que o SSH foi interrompido e, em seguida, outro e-mail dizendo que ele iniciou o backup. Curiosamente, quando essas reinicializações não especificadas ocorrem, recebo apenas um e-mail dizendo que o SSH começou a fazer backup (ou seja, não obtenho uma sobre o encerramento do SSH).
Alguém tem alguma ideia sobre o que poderia estar causando isso? Este servidor é usado apenas por nós e, certamente, não está sendo empurrado para seus limites em qualquer capacidade. O servidor está executando uma pilha LAMP tradicional ( Apache ), juntamente com o SSH, e várias outras coisas, como python, e quais não.