Aviso de isenção de responsabilidade: minhas ideias sobre quais mensagens você pode ver parecem não corresponder ao seu relatório, então, provavelmente, estou sentindo falta de algo.
Basicamente eu não conseguia pensar em muitas razões para falhas de reinicialização de software, e você definitivamente deveria querer considerar o hardware. Hipoteticamente, se você extraísse algum tipo de crash dump, seria muito frustrante interpretar se o problema é realmente hardware. Um teste de RAM seria uma ótima ideia neste momento (Inicialize emmemtest86
ou equivalente). Um teste de estresse da CPU também seria bom para verificar o superaquecimento. Pelo que você diz, você provavelmente só quer alguns minutos rodando 4% dos comandoscpuburn
.
A maior coisa que você deve excluir, dada a sua descrição, é que você ficaria sem memória e o sistema estaria se transformando em morte. Isso não deve causar uma reinicialização. A luz do disco estaria acesa. E o uso de 100% da CPU normalmente não seria esperado, mas alguns monitores podem mostrar uma CPU em 100% do estado de "Espera de E / S"; esta deve ser a sua própria cor.
Eu não esperaria que você visse uma mensagem dizendo < erro, reiniciando agora & gt ;. Você pode apenas ver algumas mensagens de uma primeira ou segunda falha antes de uma falha tripla e a tela fica preta. Essas mensagens não seriam gravadas no syslog - você precisaria configurar um console do kernel externo. (Porta serial, ou talvez netconsole). Ou experimente estas instruções breves para registar a exploração do firmware da EFI, se o tiver . Esta pode ser uma opção mais prática. Não tenho certeza se ele será ativado se você não tiver montado o sistema de arquivos pstore. Se você estiver interessado em depurar os kernels, isso parece legal.
Algumas configurações podem iniciar uma reinicialização do software. Por exemplo. panic=
opção de inicialização do kernel e / ou um temporizador de watchdog. O systemd tem um recurso de watchdog, provavelmente com um tempo limite na ordem de minutos.
Acredito que seus padrões do sistema operacional não ativarão nada disso. (Não panic=
e nenhum systemd para começar). Se você não tiver ativado, há apenas algumas falhas de software que esperamos causar reinicializações.
Se o kernel disparar uma falha no processo de tratamento de uma falha dentro do kernel (em x86), a máquina poderá reinicializar imediatamente. A.k.a. "falha tripla". Mas outros erros fatais do kernel irão "entrar em pânico", imprimir uma mensagem e não reinicializar por padrão.
Caso contrário, estamos pensando em um erro completamente maluco que aconteceu ao chamar o código de reinicialização. Provavelmente isso não iria repetir, a menos que você esteja recebendo muitos erros selvagens com efeitos estranhos de qualquer maneira.
Talvez estejamos vendo a corrupção de memória (causada durante o período ocupado), causando uma falha tripla. Mensagens do kernel durante o período ocupado podem esclarecer isso.