Limpar o log de memória do Dell OpenManage SBE de todos os conectores específicos sem reinicializar o servidor

2

A execução de omreport chassis resulta em:

Health

Main System Chassis

SEVERITY : COMPONENT
Ok       : Fans
Ok       : Intrusion
Critical : Memory
Ok       : Power Management
Ok       : Processors
Ok       : Temperatures
Ok       : Voltages
Ok       : Hardware Log
Ok       : Batteries

For further help, type the command followed by -?

A execução de dcicfg command=clearmemfailures para limpar o SBE falha:

Clearing failures using mask: 31
DIMM_X1 : failed status: 270

Com base nesta mensagem, a suposição era de que o comando deveria ser emitido na memória que está causando o problema.

Consultar a ajuda executando dcicfg command=clearmemfailures -? resultou em:

Dell(R) Data Engine Data Engine Configuration Utility  7.4.0 (BLD_1)
Copyright (C) Dell Inc. 1995-2013

Usage: dcicfg command=COMMAND [PARAMETERS...] [OPTIONS...]

COMMAND:
  clearmemfailures    Clear memory device failure mode

PARAMETERS:
  listonly=BOOLN      (opt.) list all occupied memory connectors
  connectors=STRING   (opt.) memory device connector name (default=all)
  failures=STRING     (opt.) failure type to clear (default=all)

A execução de omreport chassis memory indica qual a memória que está causando o problema:

Index          : 3
Status         : Critical
Connector Name : DIMM_Y1
Type           : DDRY - Synchronous Unregistered (Unbuffered)
Size           : Y  MB

e a emissão de dcicfg command=clearmemfailures connectors=DIMM_Y1 indicou que o conector de memória não pode ser encontrado:

Clearing failures using mask: 31
failed to find any memory connector based on the names provided

omreport chassis memory index=3 indica que a memória lançou SBEs:

Memory Device Information

Health : Critical

Status      : Critical
Device Name : DIMM_Y1
Size        : Y MB
Type        : DDRY Synchronous Unregistered (Unbuffered)
Speed       : Y ns
Rank        : Dual
Failures    : Single-bit warning error rate exceeded.
              Single-bit failure error rate exceeded.

Perguntas

  1. O que significa o status com falha 270 ?
  2. Por que o conector de memória não pode ser encontrado enquanto foi especificado e existe?
  3. Como limpar SBEs?

Tenta resolver o problema

Os seguintes comandos de este P & D :

  1. sudo omconfig system esmlog action = limpar
  2. sudo omconfig ação alertlog do sistema = clear

foram emitidos para limpar o SBE, mas o status da memória Critical persiste.

    
por 030 12.03.2015 / 19:29

2 respostas

1

Eu tive problemas para limpar o log do SBE usando dcicfg . Os passos abaixo funcionaram para mim:

Faça o download do Suporte da Dell Live Image (link para download na parte inferior deste link)

  1. Inicialize o sistema usando a opção "Ferramentas de diagnóstico baseadas no DOS (servidores Dell 9G-10G)" ou "Ferramentas de diagnóstico baseadas no DOS (servidores Dell 11G)". O menu de diagnóstico do cliente Ver 1.6 é exibido.
  2. Quando a opção ou a letra Enter for exibida, pressione o botão < 4 > chave. O prompt do MS-DOS é exibido.
  3. Digite C: e, em seguida, pressione < Digite & gt ;. A unidade atual muda para C:.
  4. Digite "mpmemory –ptech -tlogclr" e pressione < Digite >.
por 19.03.2015 / 18:02
0

Eu tive o mesmo problema. Não funcionou com apenas um sudo antes do comando.

Execute sudo su - , em seguida, chame /path/to/dcicfg command=clearmemfailures .

    
por 22.11.2016 / 20:56