Parece que isso foi causado por um driver da placa gráfica ausente. Neste caso, para nvidia. Eu instalei esses drivers e desativei a inicialização segura do UEFI e fiquei sem problemas por mais de um dia.
Acabei de instalar uma nova versão do Ubuntu 16.04. O sistema cai regularmente com a mensagem abaixo no syslog.
INFO: rcu_sched detected stalls on CPUs/tasks:
2-...: (1 GPs behind) idle=363/1/0 softirq=167130/167130 fqs=7845837
(detected by 0, t=7845872 jiffies, g=197552, c=197551, q=225464)
O tempo de atividade mostra a seguinte carga:
09:10:42 up 22:36, 1 user, load average: 4.04, 4.02, 4.00
Top mostra semelhante apesar do alto uso inativo
top - 09:11:17 up 22:37, 1 user, load average: 4.12, 4.05, 4.01
Tasks: 214 total, 2 running, 212 sleeping, 0 stopped, 0 zombie
%Cpu0 : 0.0 us, 0.0 sy, 0.0 ni, 97.3 id, 2.7 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu1 : 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu2 : 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
%Cpu3 : 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 8112956 total, 4986392 free, 1399292 used, 1727272 buff/cache
KiB Swap: 8325628 total, 8325628 free, 0 used. 6313608 avail Mem
Informações gratuitas mostram muita RAM disponível.
total used free shared buff/cache available
Mem: 7922 1366 4865 35 1690 6161
Swap: 8130 0 8130
Não vejo nenhum problema de E / S da iotop:
Total DISK READ : 0.00 B/s | Total DISK WRITE : 0.00 B/s
Actual DISK READ: 0.00 B/s | Actual DISK WRITE: 0.00 B/s
A única consistência é que parece ser cpu2 que causa as baias. O que mais eu deveria estar olhando para determinar o motivo das falhas?
Parece que isso foi causado por um driver da placa gráfica ausente. Neste caso, para nvidia. Eu instalei esses drivers e desativei a inicialização segura do UEFI e fiquei sem problemas por mais de um dia.