Identificando o que causou uma reinicialização do servidor

7

Eu tenho um HP ProLiant DL380p Gen8 que está executando VMWare ESXi 5.5 . Ele foi reinicializado em intervalos aparentemente aleatórios nas últimas 24 horas. Há apenas uma única VM em execução e, mesmo se eu desligá-la, o host ainda será reinicializado. O servidor não está ficando sem memória ou espaço em disco e, até onde eu sei, não está superaquecendo. Eu tentei procurar arquivos de log, mas há muito o que ver.

Quais são as etapas mais importantes para diagnosticar esse problema (incluindo quais configurações verificar, quais arquivos ver, que mensagem específica indicaria o problema, devo começar a extrair memória, existe um CD de diagnóstico que faz tudo isso para mim? , etc)?

Eu sei que esta é uma questão muito ampla. Fico feliz em fornecer arquivos de log, se necessário, para tornar isso mais específico para minha situação.

    
por nachito 27.08.2014 / 15:28

1 resposta

9

Aqui estão algumas sugestões.

  • A sua OIT está conectada e configurada? Ele vai dizer exatamente o que está acontecendo com o sistema. Por favor, revise o log do ILO4.

  • Veja o log do IML do sistema (disponível na guia "hardware" do ILO ou vSphere)

  • Existem indicadores ou mensagens de erro na tela durante falhas ou no POST?

  • Você está usando a instalação específica do HP do ESXi (inclui drivers e ferramentas adicionais)

  • Qual versão e número de compilação do ESXi você está executando?

  • Se a máquina virtual que você está executando for um convidado do Windows 2012 ou 2008, você pode estar correndo em um bug de driver de NIC .

  • Verifique suas conexões de energia. Você tem fontes de alimentação duplas? Recoloque os cabos de alimentação, um de cada vez.

  • Observe a matriz do LED do System Insight na frente do servidor para determinar se há um problema de integridade interno.

    
por 27.08.2014 / 15:35