Como monitorar erros de RAM ECC no processador Ivy Bridge Xeon E3 no Linux?

5

Como posso monitorar se existem erros na RAM que são corrigidos pelo ECC? O processador é um processador Intel Xeon (Ivy Bridge), o sistema operacional é o Scientific Linux 6.3. Em um sistema anterior eu tinha uma CPU AMD, e nesse sistema eu poderia usar o edac-util para obter essa informação, e também emitiria alertas para o log do kernel.

    
por Marius Bjørnstad 14.03.2013 / 23:33

2 respostas

1

Por quanto eu posso encontrar apenas E5 Xeons são suportados com o módulo sb_edac

link

    
por 21.03.2013 / 20:47
1

Desde a versão 3.17 do kernel do Linux, os erros de ECC no E3 Xeons podem ser monitorados usando o driver ie31200_edac , introduzido por este commit . Isso usa a interface EDAC padrão para que os erros possam ser listados usando edac-util .

Mais detalhadamente:

sudo modprobe ie31200-edac

carrega o driver, o que resultará em linhas como

[   14.635299] EDAC MC: Ver: 3.0.0
[   14.637898] EDAC MC0: Giving out device to module ie31200_edac controller IE31200: DEV 0000:00:00.0 (POLLED)

aparecendo no log do kernel (que está em um sistema Haswell C216); então

'edac-util'

irá reportar quaisquer erros.

Os controladores de memória Xeon D, E5 e E7 são suportados usando os módulos sb_edac ou skx_edac .

    
por 26.04.2017 / 17:37