Exceção de verificação de máquina incorrigível no HP DL360 G7

1

eu tenho aproximadamente todas as horas no IML (hplog) do registro HP DL360 G7:

CRITICAL: CPU - Uncorrectable Machine Check Exception (Board 0, Processor 1, APIC ID 0x00000003, Bank 0x00000005, Status 0xBE000000'00800400, Address 0x00003FFF'811239E0, Misc 0x00000000'00007FFF)
hpasmcli> show server
System        : ProLiant DL360 G7   
ROM version   : P68 09/30/2010
iLo present   : Yes

Alguém pode me dizer qual parte está sendo referenciada pelos códigos de status do IML acima?

Agradeço antecipadamente!

    
por ReDSerpenT 20.03.2014 / 08:58

2 respostas

2

Atualize o BIOS no servidor para a revisão atual. Se isso for reproduzível em um intervalo tão regular, isso é absolutamente a primeira coisa que eu tentaria.

A maneira mais segura de executar esta atualização é usar o recurso offline HP Service Pack para DVD ProLiant . Se não, você pode nos dizer qual sistema operacional está em uso? Você pode baixar atualizações específicas para seu servidor daqui .

Além disso, isso pode ser um problema na placa do sistema. Você pode tentar mover / recolocar os DIMMs para ver se a mensagem de erro muda (seguindo o DIMM). Se não, é provável que o soquete da CPU para o processador 1. Inspecione o soquete LGA para pinos tortos.

Você também pode ligar para o suporte HP ProLiant ...

    
por 20.03.2014 / 12:49
0

Veja aqui para mais pessoas com problemas semelhantes.

Possível solução alternativa: Na BIOS, altere o modo Regulador de energia para "Alto desempenho estático"

A resolução é provavelmente apresentada pela atualização do BIOS de 5 de maio de 2011:

Resolved an issue that may result in any of the following conditions: operating system stops responding, unexpected system reset, Blue Screen when using a Microsoft Windows operating system, kernel panic when using a Linux operating system, or Purple Screen when using VMware ESX. A message may be displayed by the operating system or logged in the HP Integrated Management Log (IML) when this issue occurs indicating an "Uncorrectable Machine Check Exception." However, there are instances where the system resets before the operating system displays an error message and instances where the IML contains no log entry when this issue occurs. This issue does not occur if the Minimum Processor Idle State is configured for No C-states or C1E-state.

    
por 20.03.2014 / 13:40