Eventos de verificação da máquina registrados

2

Em / var / log / messages, este erro ocorreu:

Sep 19 13:18:15 wdc kernel: [2772302.630416] Machine check events logged

Logo depois, todo o servidor ficou sem resposta. Isso está no log do Dom0 para um servidor Xen (executando a versão mais recente no Debian Squeeze).

Alguém pode esclarecer o que esse erro significa? Devo encomendar novo hardware?

Edit: Além disso, parece implicar que ele registrou algo, onde posso encontrar isso?

    
por GoldenNewby 19.09.2012 / 21:43

2 respostas

6

Para obter mais informações, verifique o arquivo de log (esse arquivo de log pode estar ou não estar, depende de como ele está configurado em /etc/mcelog/mcelog.conf), onde deve haver uma descrição detalhada do problema encontrado.

/var/log/mcelog

ou apenas execute o comando

mcelog


O Mcelog está decodificando o log de verificação da máquina kernel em máquinas x86. De man mcelog :

X86  CPUs  report  errors  detected by the CPU as machine check events (MCEs).  These
can be data corruption detected in the CPU caches, in main memory by an integrated
memory controller, data transfer errors on the front side bus or CPU interconnect or
other internal errors. Possible causes can be cosmic radiation, instable power
supplies, cooling problems, broken hardware, or bad luck.
Most  errors  can  be  corrected by the CPU by internal error correction mechanisms.
Uncorrected errors cause machine check exceptions which may panic the machine.
When a corrected error happens the x86 kernel writes a record describing the MCE into
a internal ring buffer available through  the  /dev/mcelog device  mcelog retrieves
errors from /dev/mcelog, decodes them into a human readable format and prints them on
the standard output or optionally into the system log.


Você pode encontrar mais informações sobre o mcelog e suas configurações / erros / gatilhos na página do projeto página do projeto Mcelog

    
por 19.09.2012 / 22:05
0

As entradas de log foram escritas por mcelog . Seu logfile pode ser encontrado em /var/log/mcelog , ou dependendo do sistema, adicionalmente no syslog ou no diário do systemd.

As CPUs X86 têm a capacidade de detectar e algumas vezes corrigir erros de hardware (erros de hardware de memória, IO e CPU). O mcelog recupera esses erros de /dev/mcelog , onde o kernel do Linux grava então.

Como o seu sistema travou, a correção do hardware provavelmente falhou. Se o sistema continuar em execução, a correção automática parece estar funcionando.

Para obter mais informações sobre as implicações de ver essas mensagens, consulte

    
por 14.08.2017 / 13:05