Ação de recuperação para a página do kernel reservada: falha

0

Em uma nova instalação do servidor Ubuntu 14.04.4, a versão do kernel é 4.2.0-27-generic , existem as seguintes entradas no arquivo syslog.

MCE:0x10de:reserved kernel page still referenced by 1 users
MCE:0x10de:recovery action for reserved kernel page:Failed
MCE:0x10a1:already hardware poisoned

O que significam as entradas? O que significa "já envenenado por hardware"? Como resolver isso?

    
por Eric 10.06.2016 / 04:39

1 resposta

1

O processador está respondendo a uma MCE (Machine Check Exception) em uma página de memória. Um MCE é um erro de hardware e pode ser um dos seguintes:

1) Um erro no barramento do sistema (erro de dados entre o processador e a placa-mãe).

2) Erro de memória: uma verificação de paridade detectou um erro de memória.

3) Erros de cache do processador.

No seu caso, suspeito que tenha ocorrido uma falha na verificação de paridade de memória e o kernel tentou usar o ECC (código de correção de erros) para tentar corrigir isso, mas havia muitos bits corrompidos, então não foi possível.

A primeira mensagem do kernel está informando que a página corrompida da memória é uma página usada pelo próprio kernel e está sendo compartilhada / usada por apenas 1 usuário.

A segunda mensagem do kernel está informando que o erro de página não pôde ser restaurado / corrigido.

A mensagem final do kernel refere-se ao fato de que o hardware detectou o erro de memória, a página foi marcada como precisando de correção "aka poisoned" e mais tarde, quando a página foi lida, ocorreu o MCE e relatou o fato de a página ter sido foi marcado como envenenado. Esta é uma operação preguiçosa porque às vezes uma página pode ficar corrompida, mas depois é gravada para que ela nunca seja lida, portanto não há necessidade de consertá-la.

Como este é um erro de hardware, pode ser devido a problemas físicos, ou talvez apenas um movimento aleatório causado por raios cósmicos. Se ocorrer com freqüência, verifique se a memória está encaixada corretamente.

    
por Colin Ian King 10.06.2016 / 09:20