Definindo o tempo limite para o HP iLO VSP para capturar o kernel panic

3

Então, eu tenho um servidor que foi trancado duas vezes recentemente.

O que eu quero fazer é pegar qualquer kernel panic / oops escrito no console serial. Eu posso ssh e iniciar o VSP e estou executando minha sessão SSH no bash usando o script para que qualquer coisa escrita no console seja registrada pelo script.

O problema é o tempo limite do iLO e fecha a sessão SSH.

Uma rápida olhada na interface da web mostra que há um tempo limite ocioso do iLO, mas que só pode ser definido como máximo de 120 minutos e não desativado.

Existe alguma maneira de desabilitar o iLO para fechar a sessão SSH para que eu possa efetivamente registrar o que é colocado na porta serial virtual por algum tempo, e capturar o que quer que seja que pânico / oops é cuspido nesses bloqueios aparentemente aleatórios.

    
por Steven Williamson 08.09.2011 / 21:47

3 respostas

3

Você está vendo algo nos registros IML do sistema? Você tem os agentes de gerenciamento instalados para o hardware?

Qual SO específico e modelo do servidor ProLiant você está usando? Se você tiver os agentes instalados, você deve obter algumas informações relevantes para os bloqueios ou possivelmente disparar o temporizador do watchdog ASR.

Para o VSP. Você fez as alterações necessárias na linha de comando do kernel e no Grub . saída para o console?

Para o ILO, a revisão do modelo e do firmware faz a diferença. O firmware atual do ILO2 e ILO3 permite um tempo limite inativo Infinito em Access Options .

    
por 08.09.2011 / 22:09
2

Se você pode usar o PuTTY, talvez você possa evitar que ocorra um intervalo ...

    
por 08.09.2011 / 22:15
1

Não tenho certeza se a implementação do SSH do ilo é compatível, mas usar o cliente openssh e definir ServerAliveInterval pode ajudar. O padrão é 0. Eu uso para manter minhas conexões ssh ativas para evitar tempos limite do temporizador nat table. Em ~/.ssh/config put:

ServerAliveInterval 60
    
por 08.09.2011 / 22:19