Tempo limite de configuração de problemas para o teste do Nagios

1

Eu tenho o Nagios monitorando uma instalação do Oracle em um servidor diferente. Às vezes, um teste em particular (verifique se o espaço de tabela do oracle pode alocar a próxima extensão) falhará com "CRITICAL - O plug-in expirou após 10 segundos".

A primeira coisa que quero fazer é descobrir quanto tempo demora a completar. Se são 11 segundos, talvez eu não me importe, e eu só quero definir o tempo limite um pouco maior.

Eu tentei definir o tempo limite para check_by_ssh, que é usado para executar o comando real, assim:

define command {
  command_name    check_ssh_oracle_health
  command_line    $USER1$/check_by_ssh -H $HOSTADDRESS$ -C 
      "/export/home/nagios/libexec/check_oracle_health --mode=$ARG1$ --environment 
      ORACLE_HOME=/u01/app/oracle/product/11.2.0/dbhome_1 
      --connect=nagios/<pwd>@<SID> --timeout=15"
}

Isso não teve efeito; o teste ainda comete erros e ainda diz que aconteceu depois de 10 segundos (e sim, reiniciei o Nagios :).

O único outro lugar que posso ver para definir um tempo limite está em nagios.cfg; que parece muito alto nível (isso afetaria todos os testes) e, além disso, nenhum deles está atualmente definido para 10 segundos, então eu duvido que este é o lugar certo.

Algum apontador?

    
por Janine Ohmer 14.04.2011 / 23:07

1 resposta

3

Eu acho que é o check_by_ssh que está expirando (10 segundos é o tempo limite padrão para essa verificação) e não o check_oracle_health dentro dele. Tente definir o tempo limite de check_by_ssh para um valor mais alto e veja se ainda acontece.

Espero que isso ajude!

    
por 15.04.2011 / 00:43