O kernel: EDAC MC0: Página de UE 0x0 aponta para memória ruim, um driver ou algo mais?

7

kernel: EDAC MC0: UE page 0x0, offset 0x0, grain 0, row 7, labels ":": i3200 UE

De repente, hoje, o nosso sistema CentOS Release 6.4 (Final) começou a lançar erros no EDAC. Eu reiniciei e os erros pararam.

Eu tenho procurado por respostas, mas elas caem em dois campos, memória ou um chipset. Eu gostaria de alguns conselhos sobre onde pesquisar mais para restringir isso ao chipset ou à memória.

    
por octopusgrabbus 16.07.2013 / 19:52

1 resposta

8

O que você está enfrentando é uma Detecção de erros e Correção . Dado o erro inclui este bit: MC0 você está tendo um erro de memória. Esta mensagem está dizendo onde você está especificamente com o erro. MC0 significa a RAM no primeiro socket (# 0). O resto da mensagem está dizendo especificamente dentro desse RAM DIMM que o erro ocorreu.

Dado que você está recebendo apenas um, eu continuaria a monitorá-lo, mas não faria nada por enquanto. Se continuar, provavelmente você está tendo um módulo de memória com falha.

Você também pode tentar testá-lo mais completamente usando memtest86 + .

Esta pergunta anterior intitulou: Como colocar uma lista negra de um setor de RAM incorreto de acordo com o MemDest86 + imdocation de erro? mostrará a você como colocar uma lista negra na memória se você estiver interessado nisso também.

    
por 16.07.2013 / 21:02