Estávamos tendo um caso semelhante de congelamento da máquina entre 10 minutos e 6 horas de funcionamento. Estávamos usando o Linux Mint 18.2 e o Ubuntu 16.04 em duas novas máquinas diferentes com processadores AMD FX (tm) -8350 de oito núcleos.
Isso pareceu ser independente da carga do processador. Não poderia ser causas por estresse. Pode ocorrer a baixa temperatura do núcleo.
Observe que nosso syslog
mostrou a mensagem de erro virtualmente idêntica repetindo-se em intervalos de 3 minutos.
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705896] INFO: rcu_sched detected stalls on CPUs/tasks:
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705909] 7-...: (3 GPs behind) idle=5df/1/0 softirq=362596/362596 fqs=5806
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705913] (detected by 4, t=15002 jiffies, g=556997, c=556996, q=1370)
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705919] Task dump for CPU 7:
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705921] swapper/7 R running task 0 0 1 0x00000008
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705928] 0000000000000010 0000000000000246 ffff8be1cd6d3e70 0000000000000018
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705933] 7735940000000000 000013745a87802e 0000000000000007 ffff8be1cd6d4000
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705937] ffff8be1ccffd600 ffffffff826bc300 ffff8be1cd6d0000 ffff8be1cd6d3eb8
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705942] Call Trace:
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705954] [<ffffffff81f19527>] ? cpuidle_enter+0x17/0x20
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705959] [<ffffffff818c7a0a>] ? call_cpuidle+0x2a/0x50
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705963] [<ffffffff818c7dee>] ? cpu_startup_entry+0x29e/0x350
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705967] [<ffffffff818518b1>] ? start_secondary+0x151/0x190
Depois que começamos a usar o firmware de microcódigo do processador AMD proprietário (amd64-microcode / Version 2.20160316.1), as duas máquinas estavam funcionando no início sem aparente parada. No entanto, somente após a atualização do kernel (para o 4.10 na máquina Mint e 4.13 na máquina Ubuntu), as máquinas não exibiam mais o travamento. Isto foi avaliado durante um período de ~ 48h.