Por quanto eu posso encontrar apenas E5 Xeons são suportados com o módulo sb_edac
Como posso monitorar se existem erros na RAM que são corrigidos pelo ECC? O processador é um processador Intel Xeon (Ivy Bridge), o sistema operacional é o Scientific Linux 6.3. Em um sistema anterior eu tinha uma CPU AMD, e nesse sistema eu poderia usar o edac-util para obter essa informação, e também emitiria alertas para o log do kernel.
Por quanto eu posso encontrar apenas E5 Xeons são suportados com o módulo sb_edac
Desde a versão 3.17 do kernel do Linux, os erros de ECC no E3 Xeons podem ser monitorados usando o driver ie31200_edac
, introduzido por este commit . Isso usa a interface EDAC padrão para que os erros possam ser listados usando edac-util
.
Mais detalhadamente:
sudo modprobe ie31200-edac
carrega o driver, o que resultará em linhas como
[ 14.635299] EDAC MC: Ver: 3.0.0
[ 14.637898] EDAC MC0: Giving out device to module ie31200_edac controller IE31200: DEV 0000:00:00.0 (POLLED)
aparecendo no log do kernel (que está em um sistema Haswell C216); então
'edac-util'
irá reportar quaisquer erros.
Os controladores de memória Xeon D, E5 e E7 são suportados usando os módulos sb_edac
ou skx_edac
.