Eu tenho o Nagios monitorando uma instalação do Oracle em um servidor diferente. Às vezes, um teste em particular (verifique se o espaço de tabela do oracle pode alocar a próxima extensão) falhará com "CRITICAL - O plug-in expirou após 10 segundos".
A primeira coisa que quero fazer é descobrir quanto tempo demora a completar. Se são 11 segundos, talvez eu não me importe, e eu só quero definir o tempo limite um pouco maior.
Eu tentei definir o tempo limite para check_by_ssh, que é usado para executar o comando real, assim:
define command {
command_name check_ssh_oracle_health
command_line $USER1$/check_by_ssh -H $HOSTADDRESS$ -C
"/export/home/nagios/libexec/check_oracle_health --mode=$ARG1$ --environment
ORACLE_HOME=/u01/app/oracle/product/11.2.0/dbhome_1
--connect=nagios/<pwd>@<SID> --timeout=15"
}
Isso não teve efeito; o teste ainda comete erros e ainda diz que aconteceu depois de 10 segundos (e sim, reiniciei o Nagios :).
O único outro lugar que posso ver para definir um tempo limite está em nagios.cfg; que parece muito alto nível (isso afetaria todos os testes) e, além disso, nenhum deles está atualmente definido para 10 segundos, então eu duvido que este é o lugar certo.
Algum apontador?