HP DL165G7: erro de NMI

4

Um dos "meus" Proliants do DL165 G7 foi reiniciado inesperadamente pela segunda vez este mês. A reinicialização foi acompanhada por essas entradas do log de eventos do sistema no LightsOut:

Event Type  Date    Time    Source  Description Direction
OEM --  --  --  00 00 00 00 01 02 00 00 00 00 00 00 00  --
Generic 07/19/2013  16:40:38    NMI Detect  State Asserted  Assertion
Generic 07/19/2013  16:40:42    Gen ID 0x41 Run-time Stop   Assertion
OEM 07/19/2013  16:40:42    000137  01 80 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  02 54 44 4f 00 01   --
OEM 07/19/2013  16:40:42    000137  02 00 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  03 00 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  03 00 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  04 00 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  04 00 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  05 00 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  05 00 00 00 00 01   --
Generic 07/19/2013  16:43:54    Gen ID 0x41 C: boot completed   Assertion
OEM 07/19/2013  16:43:54    000137  00 b4 6c e9 51 00   --

Entrei em contato com o suporte da HP para obter ajuda na decodificação dos eventos, mas infelizmente sem nenhum sucesso notável - foi-me dito que não há documentação acessível disponível. O que está tentando me dizer e como descubro o que está quebrado aqui?

Editar: o sistema está executando o Hyper-V 2012. O único evento útil relacionado à reinicialização é o Kernel-Power / 41 com um BugcheckCode de 128 / 0x00000080 e BugcheckParameter1 de 0x4f4454 que correspondem às duas primeiras linhas OEM do log de eventos do iLO (depois de trocar os bytes na maneira little-endian, pelo menos). O código do bugcheck levou-me a este artigo do MSDN , que é sem rodeios afirmando que "a causa exata é difícil de determinar" .

No centro de suporte da HP, eu encontrei um descrição do problema aparentemente semelhante com a solução sendo sincronizar os relógios entre os nós do cluster. Embora meu host de interrupção realmente seja executado em um cluster, tenho os relógios sincronizados e não consigo reproduzir o problema quando os relógios estão se afastando (os problemas óbvios de autenticação Kerberos deixam de lado, nada acontece se eu desassociar os relógios). p>

As informações ímpares que consegui coletar sobre o assunto até agora:

por the-wabbit 19.07.2013 / 18:40

1 resposta

1

Eu tive um problema semelhante com o HP ProLiant G380 G6 e o Windows 2008 R2, procurando nos fóruns de suporte e ajuda que me levaram a nenhum lugar, e usei o DVD do HP Smart Update Manager para instalar todas as atualizações mais recentes no servidor, um ano e meio passado sem erros até agora.

Pode ser uma tentativa remota, mas tente usar as atualizações mais recentes, eis o mais recente DVD do HP SUM

Se você tentar executar isso em um servidor de 2012, poderá receber um erro que não seja compatível, de acordo com a HP que é normal e só é necessário ignorar o erro.

Espero que isso ajude.

    
por 22.07.2013 / 10:41