NMI recebida por motivo desconhecido 20 - Você tem um estranho modo de economia de energia ativado?

3

Estou usando o Debian GNU / Linux 7.8 (wheezy). Ao executar meu programa MATLAB hoje, recebi esta mensagem no terminal.

Message from syslogd@sas21 at Jul 18 16:40:49 ...
 kernel:[1747708.091929] Uhhuh. NMI received for unknown reason 20 on CPU 4.

Message from syslogd@sas21 at Jul 18 16:40:49 ...
 kernel:[1747708.091932] Do you have a strange power saving mode enabled?

Message from syslogd@sas21 at Jul 18 16:40:49 ...
 kernel:[1747708.091932] Dazed and confused, but trying to continue

Eu também lembro de ouvir algum som de bipe no meio.

O que isso significa? E o que devo fazer mais?

    
por dexterdev 18.07.2015 / 15:36

4 respostas

1

Esta é uma Interrupção Não-Mascarável (NMI) e geralmente é acionada por um evento de hardware em seu sistema. Neste caso, parece que o NMI específico não está configurado e, apesar de ter recebido o NMI, ele não sabe o que fazer com ele, então ele simplesmente o ignora.

O que você deve fazer mais?

  • Se você quiser apenas se livrar da mensagem, tente ocultá-la na linha de comando, configurando o syslogd.
  • Se você quiser corrigir o problema de segundo plano, precisará selecionar o que foi alterado na máquina (por exemplo, novo hardware / driver adicionado?).
por 18.07.2015 / 15:59
0

Estou tendo o mesmo problema desde alguns dias no meu host KVM / QEMU executando o Debian 8.6 com o kernel 3.16.0-4-amd64. Isso faz parte do meu log:

Jan 01 13:07:42 debbi3 kernel: Uhhuh. NMI received for unknown reason 20 on CPU 0. Jan 01 13:07:42 debbi3 kernel: Do you have a strange power saving mode enabled? Jan 01 13:07:42 debbi3 kernel: Dazed and confused, but trying to continue Jan 02 10:48:58 debbi3 kernel: Uhhuh. NMI received for unknown reason 30 on CPU 0. Jan 02 10:48:58 debbi3 kernel: Do you have a strange power saving mode enabled? Jan 02 10:48:58 debbi3 kernel: Dazed and confused, but trying to continue

Isto começou depois de instalar o BOINC (a tarefa atual é a Conjectura Collatz). Atualmente estou permitindo que o BOINC consiga 99% da CPU.

Então, meu palpite sobre a causa dessas mensagens é que a CPU está saturada e não tem tempo suficiente para lidar com interrupções (de hardware) corretamente. Em seu caso particular, algum outro processo ou causa externa pode ser o culpado. YMMV.

Espero que isso ajude.

    
por 02.01.2017 / 17:41
0

Eu já vi esse comportamento em um convidado da máquina virtual KVM executando o Debian 9.0 (Stretch) usando o tipo de hardware PC-Q35. O host é um AMD Turion.

Várias soluções são sugeridas on-line (veja, por exemplo, este tópico ), incluindo o seguinte

  1. Alternando para uma CPU emulada do QEMU em vez de usar a passagem da CPU.
  2. Alterando o cronômetro do KVM (adicionando <timer name='kvmclock' present='no'/> ao convidado).
  3. Desabilitando o suporte a ACPI no guest.

No meu caso, a mudança para uma CPU emulada do QEMU corrigiu o problema. Para fazer isso, removi a seguinte linha do meu arquivo XML da VM: <cpu mode='host-passthrough'/>

    
por 21.11.2017 / 10:41
0

Talvez a CPU esteja ficando muito quente e gerando pequenos erros, ou estrague algumas instruções, mas esses erros não-críticos ainda podem ser recuperados pelo kernel internamente.

Eu recebi mensagens semelhantes, mas no meu caso eu sei que é a GPU que está ficando muito quente. O que fiz foi assistir a uma transmissão ao vivo de alta resolução no meu PC. Eu sei que as GPUs são bem antigas e fracas, então isso apareceu no meu log de erros:

Feb 15 10:39:14  kernel: [ 1708.477285] nouveau 0000:03:00.0: therm: temperature (86 C) went below the 'fanboost' threshold
Feb 15 10:39:16  kernel: [ 1710.452080] nouveau 0000:03:00.0: therm: temperature (90 C) hit the 'fanboost' threshold
Feb 15 10:39:21  kernel: [ 1714.926254] nouveau 0000:03:00.0: therm: temperature (86 C) went below the 'fanboost' threshold
Feb 15 10:39:23  kernel: [ 1717.261238] nouveau 0000:03:00.0: therm: temperature (90 C) hit the 'fanboost' threshold
Feb 15 10:39:23  kernel: [ 1717.535168] Uhhuh. NMI received for unknown reason 21 on CPU 0.
Feb 15 10:39:23  kernel: [ 1717.535172] Do you have a strange power saving mode enabled?
Feb 15 10:39:23  kernel: [ 1717.535173] Dazed and confused, but trying to continue
Feb 15 10:39:32  kernel: [ 1725.650454] nouveau 0000:03:00.0: therm: temperature (86 C) went below the 'fanboost' threshold
Feb 15 10:39:33  kernel: [ 1726.662936] nouveau 0000:03:00.0: therm: temperature (90 C) hit the 'fanboost' threshold
Feb 15 10:39:37  kernel: [ 1730.652335] nouveau 0000:03:00.0: therm: temperature (86 C) went below the 'fanboost' threshold

e muitos mais

    
por 15.02.2018 / 11:05