rcu_sched detectou barracas em CPUs / tarefas Ubuntu 16.10 servidor pendurado depois de algum tempo

0

Estou tentando configurar um servidor Ubuntu 16.10. Eu instalei e atualizei o sistema usando o apt-get. Mas depois de algum tempo a execução do sistema trava e recebo o seguinte erro:

Eu tive um problema semelhante ao executar o Ubuntu Server 16.04 LTS

Eu acho que pode ser um problema de hardware. Mas estou procurando uma maneira de determinar a causa. Alguém pode me fornecer alguma orientação?

    
por Leandro Tavares 09.01.2017 / 23:10

1 resposta

0

Estávamos tendo um caso semelhante de congelamento da máquina entre 10 minutos e 6 horas de funcionamento. Estávamos usando o Linux Mint 18.2 e o Ubuntu 16.04 em duas novas máquinas diferentes com processadores AMD FX (tm) -8350 de oito núcleos.

Isso pareceu ser independente da carga do processador. Não poderia ser causas por estresse. Pode ocorrer a baixa temperatura do núcleo. Observe que nosso syslog mostrou a mensagem de erro virtualmente idêntica repetindo-se em intervalos de 3 minutos.

Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705896] INFO: rcu_sched detected stalls on CPUs/tasks:
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705909]  7-...: (3 GPs behind) idle=5df/1/0 softirq=362596/362596 fqs=5806 
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705913]  (detected by 4, t=15002 jiffies, g=556997, c=556996, q=1370)
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705919] Task dump for CPU 7:
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705921] swapper/7       R  running task        0     0      1 0x00000008
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705928]  0000000000000010 0000000000000246 ffff8be1cd6d3e70 0000000000000018
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705933]  7735940000000000 000013745a87802e 0000000000000007 ffff8be1cd6d4000
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705937]  ffff8be1ccffd600 ffffffff826bc300 ffff8be1cd6d0000 ffff8be1cd6d3eb8
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705942] Call Trace:
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705954]  [<ffffffff81f19527>] ? cpuidle_enter+0x17/0x20
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705959]  [<ffffffff818c7a0a>] ? call_cpuidle+0x2a/0x50
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705963]  [<ffffffff818c7dee>] ? cpu_startup_entry+0x29e/0x350
Oct 19 14:00:41 blanked_out_usr-desktop kernel: [21450.705967]  [<ffffffff818518b1>] ? start_secondary+0x151/0x190

Depois que começamos a usar o firmware de microcódigo do processador AMD proprietário (amd64-microcode / Version 2.20160316.1), as duas máquinas estavam funcionando no início sem aparente parada. No entanto, somente após a atualização do kernel (para o 4.10 na máquina Mint e 4.13 na máquina Ubuntu), as máquinas não exibiam mais o travamento. Isto foi avaliado durante um período de ~ 48h.

    
por Robert Guggenberger 20.10.2017 / 12:04