Dell Power Edge 2950 - E211 ERRO DE REGISTRO DIMM6

2

Alguma ideia do que este erro E211 SBE LOG DISABLE DIMM6 pode significar? Alguém já experimentou isso?

Eu sei que isso soa bastante óbvio, esse é o 6º banco da minha memória e o convidado:

  • Eu já mudei a ordem dos módulos de RAM. O mesmo erro no mesmo slot DIMM
  • A Dell já substituiu o MOBO por um novo. Módulos de RAM conectados em ordem diferente, mesmo erro. Já limpou os logs com o OECA livecd.
  • Inicializar no memtest + não mostra nada
  • Todos os firmwares possíveis nesta placa-mãe estão atualizados

Poderia ser outro componente ou um problema de firmware?

A Dell também está dando uma olhada, mas não encontrou nada nos registros do sistema criados pelo OMSA.

Um sintoma claro é que o erro começa após uma hora de operação. O sistema operacional neste hardware é o ESXi 5.0.1. Nenhuma falha do sistema resultou devido a esse erro.

Editar: eu limpei os logs do BIOS através de /opt/dell/dset/clearesm.sh (OMSA liveCD) no novo mobo, reiniciei no memtest + (ainda no livecd) e após 20 minutos o display ativou a mensagem de erro e o memtest não encontrou erros ...

Editar 2: ./dcicfg32 command=clearmemfailures nem a BCM limpa na Bios (Control + E durante o menu de registro de eventos do Post - > - > Limpar log de eventos do sistema) parece resolver a questão . Após 20 minutos de operação, o erro volta.

Editar 3: O MOBO foi alterado (veja acima) e ambos tiveram / tiveram o mesmo erro. Trocar posições de memória ou usar a memória de outras alterações do servidor 2950 nada no erro.

    
por nwildner 08.07.2013 / 23:01

2 respostas

4

Isso indica que ocorreu um erro de bit único (SBE) no DIMM 6 com uma frequência tal que o sistema não está mais registrando o erro até que ele seja reinicializado. (Veja o link para informações básicas.)

É um pouco desconcertante que você esteja vendo o mesmo erro após a substituição da placa-mãe, mas é possível que a placa de substituição tenha o mesmo defeito da primeira placa. Como você moveu os DIMMs e o problema não acompanhou o DIMM, é menos provável que suspeite do DIMM.

Eu usaria o diagnóstico Dell MpMemory apropriado para esse servidor em vez de memtest +. A ferramenta da Dell está ciente de todos os recursos de hardware específicos da Dell.

    
por 08.07.2013 / 23:20
1

Uma pergunta, quando você disse "tente limpar os logs de mobo", você está se referindo aos logs do BMC (Logs de Hardware), ou para redefinir o contador de erros de memória, se você está falando sobre o BMC que você precisa fazer é apenas limpar contador SBE, pelo menos, para ter certeza não é um falso aviso.

Para limpar o contador de registros do SBE, você pode executar o seguinte comando "./dcicfg32 command = clearmemfailures" do LIveCD.

    
por 09.07.2013 / 18:52