Se você estiver realmente preocupado com a reinicialização devido a pânico do kernel, como sugere o título da postagem, verifique o arquivo /etc/sysctl.conf
para uma diretiva semelhante a kernel.panic = n
, em que n
é algum número que indica quantos segundos para atrasar antes de reinicializar no mesmo de um kernel panic. Pesquisas indicam que não é necessário reiniciar por padrão.
Se, em vez disso, suspeitar que você está mais preocupado em determinar a causa raiz dessas reinicializações (alguma falha relacionada ao hardware é minha opinião), convém revisar os eventos de verificação da Máquina para determinar qual hardware está com defeito. Se você não tiver o arquivo /var/log/mcelog
, talvez seja necessário instalar o o pacote mcelog ativando o repositório Universe (se ainda não estiver ativado em suas fontes) e emitindo o comando sudo apt install mcelog
Em seguida, o avanço desses eventos será registrado em /var/log/mcelog
Para maior clareza, veja um trecho da man mcelog
X86 CPUs report errors detected by the CPU as machine check events
(MCEs). These can be data corruption detected in the CPU caches, in
main memory by an integrated memory controller, data transfer errors on
the front side bus or CPU interconnect or other internal errors. Pos‐
sible causes can be cosmic radiation, instable power supplies, cooling
problems, broken hardware, or bad luck.
Most errors can be corrected by the CPU by internal error correction
mechanisms. Uncorrected errors cause machine check exceptions which may
panic the machine.
Mais informações sobre o formato de arquivo mcelog podem ser encontradas aqui
Os sistemas Linux normalmente não são reinicializados devido ao pânico do kernel por padrão, portanto, você pode usar widh para verificar o arquivo /etc/sysctl.conf
mencionado anteriormente.
Fontes:
Com base no seu mcelog, as CPUs 1 e 3 do seu sistema estão superaquecendo. Acelerando, esfriando e acelerando o backup (tudo isso é próprio do projeto para proteger o processador contra superaquecimento). A causa raiz pode ser um composto térmico mal aplicado entre a CPU e o dissipador de calor, um dissipador de calor solto, aberturas bloqueadas ou equipamento de resfriamento excessivamente empoeirado ou com falha (ventilador?). Outra (improvável) possibilidade é uma falha nas capacidades de detecção térmica da CPU.