digitou 'apt-get update' agora mostrando uma longa lista de erros do EDAC. Há algo de errado?

2

Eu digitei apt-get update e depois vi uma longa lista de

EDAC i7Core: Lost 127 memory errors

Por favor, ajude-me a entender o que aconteceu.

Estou usando a edição do servidor Ubuntu 12.04 LTS

ATUALIZAÇÃO:

Eu segui a resposta de Gilles. Eu tenho o seguinte quando eu faço um dmesg

[113893.215234] EDAC MC0: CE error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0 page:0x0 offset:0x0 grain:8 syndrome:0x0)
[113893.215237] EDAC MC0: CE error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0 page:0x0 offset:0x0 grain:8 syndrome:0x0)
[113893.215240] EDAC MC0: CE error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0 page:0x0 offset:0x0 grain:8 syndrome:0x0)
[113893.215243] EDAC MC0: CE error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0 page:0x0 offset:0x0 grain:8 syndrome:0x0)
[113893.215246] EDAC MC0: CE error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0 page:0x0 offset:0x0 grain:8 syndrome:0x0)
[113893.215248] EDAC MC0: CE error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0 page:0x0 offset:0x0 grain:8 syndrome:0x0)
[113893.215251] EDAC MC0: CE error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0 page:0x0 offset:0x0 grain:8 syndrome:0x0)
    
por Kim Stacks 19.08.2013 / 03:22

1 resposta

7

EDAC é o componente do kernel que procura erros de memória. Você recebe uma mensagem sobre erros de memória perdida quando tantos erros ocorreram em um intervalo curto que o kernel não conseguiu registrá-los.

Um erro de memória é uma coisa ruim. Verifique seus logs do kernel ( /var/log/kern.log ) para mensagens como esta:

EDAC MC0: CE page 0x283, offset 0xce0, grain 8, syndrome 0x6ec3, row 0, channel 1 "DIMM_B1": amd76x_edac

CE indica um erro que foi corrigido. Se a sua RAM tiver correção de erros, não há problema em corrigir um erro corrigido de vez em quando. Mas quando você chega ao ponto em que os erros de memória se perdem devido ao seu número, é hora de substituir sua memória RAM. A mensagem indica qual módulo de RAM (DIMM) está com defeito.

Se você vir UE em vez de CE , isso significa que um erro foi detectado, mas não corrigido. Você pode ter dados corrompidos.

Se a sua memória RAM e CPU não suportam correção de erros, então o primeiro sinal de que sua RAM está com defeito é quando você percebe que seus dados estão corrompidos.

Isso não tem nada a ver com apt-get update , esse é o comando que você executou quando os erros aconteceram.

Substitua sua memória RAM ontem.

    
por Gilles 19.08.2013 / 03:35