Esta não é uma resposta completa. Como você tem um sistema caseiro, eu leio o dmesg
dump com o Paranoia definido como Alto, e o Confusion filter definido como Baixo (Muito paranoico, Facilmente confuso no eu virtual), e encontrei vários itens de interesse:
Isso poderia ser problemático, você deve investigar.
623 Sep 30 07:43:26 ubuntu-server kernel: [ 0.907105] hpet: number irqs doesn't agree with number of timers
Considere instalar thermald
.
672 Sep 30 07:43:26 ubuntu-server kernel: [ 0.998865] Consider also installing thermald for improved thermal control.
Este é o que eu realmente suspeito. Quais processos você está executando em "Tempo Real"? Se um processo em tempo real perder sua mente, ele pode consumir TODA a CPU e parecer com o problema relatado. (assim seria um súbito H / W spaz). Você poderia correr por um tempo sem rtkit?
1086 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Successfully called chroot.
1087 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Successfully dropped privileges.
1088 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Successfully limited resources.
1089 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Running.
1090 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Watchdog thread running.
1091 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Canary thread running.
1093 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Successfully made thread 2010 of process 2010 (n/a) owned by '1000' high priority at nice level -11.
1094 Sep 30 07:43:41 ubuntu-server rtkit-daemon[2012]: Supervising 1 threads of 1 processes of 1 users.
1097 Sep 30 07:43:42 ubuntu-server rtkit-daemon[2012]: Successfully made thread 2083 of process 2010 (n/a) owned by '1000' RT at priority 5.
1098 Sep 30 07:43:42 ubuntu-server rtkit-daemon[2012]: Supervising 2 threads of 1 processes of 1 users.
1099 Sep 30 07:43:42 ubuntu-server rtkit-daemon[2012]: Successfully made thread 2084 of process 2010 (n/a) owned by '1000' RT at priority 5.
1100 Sep 30 07:43:42 ubuntu-server rtkit-daemon[2012]: Supervising 3 threads of 1 processes of 1 users.
Problema no sistema de registro? Corrija isto em princípios gerais.
3293 Oct 1 08:02:11 ubuntu-server rsyslogd-2039: Could no open output pipe '/dev/xconsole': No such file or directory [try http://www.rsyslog.com/e/2039 ]
E isso é um desligamento normal:
3935 Oct 1 08:10:42 ubuntu-server rsyslogd: [origin software="rsyslogd" swVersion="7.4.4" x-pid="967" x-info="http://www.rsyslog.com"] exiting on signal 15.
Para chegar mais perto de ver a última entrada de registro antes da falha, inicie-a em um shell (para que NÃO seja reiniciado automaticamente):
# set nap to sleep time (GNU sleep takes floating point values)
nap=2.5
# forever, or until the world ends
while [[ : ]] ; do
dmesg -T >logfile
sleep $nap
done
Após a falha, verifique a data de modificação e o conteúdo de logfile
. Aumente o valor de $nap
para diminuir a carga no sistema, diminua o valor para armazenar dmesg
mais próximo do tempo da falha (ao custo de mais carga). Mas isso é uma depuração temporária, então você não se importa muito com a carga. Seja um artigo que entre o dmesg -T >logfile
e os dados sendo preservados no disco, há sobrecarga, buffer, etc. Se o sistema falhar antes que os dados cheguem ao disco, eles serão perdidos, mas o hardware de depuração e / ou tempo real é difícil.