Então, estou tentando configurar um serviço Nagios check_load em um servidor Red Hat. Eu segui a documentação da Red Hat para instalar o cliente NRPE: link
Na GUI do Nagios, eu entendo isso:
CHECK_NRPE: Error receiving data from daemon.
Mas quando eu logar no servidor Nagios para depurar, parece que posso executar esta multa a partir do terminal:
root@portalmon:/Nagios# /usr/local/nagios/libexec/check_nrpe -H 10.0.XX.XXX -c check_load -t 30
OK - load average: 0.15, 0.10, 0.04|load1=0.150;15.000;30.000;0; load5=0.100;10.000;25.000;0; load15=0.040;5.000;20.000;0;
Então, não acho que seja um problema de permissão. Acho que é algum tipo de problema de caminho, mas não consigo entender por que isso não está funcionando. Alguém pode ajudar?
Aqui está minha descrição de serviço:
define service{
use dev-service
host_name [DEV] Luminis Admin DEV Portal
service_description CPU-Load
check_command check_nrpe!"check_load"
}
Gostaria de saber se estou ligando para o mesmo serviço quando executo o comando do terminal acima.
EDIT : Eu descobri a questão. Agora trabalhando na resolução. Eu mudei o Nagios para o modo de depuração e olhando para /usr/local/nagios/var/nagios.debug eu percebi que o comando que estava sendo executado era
/usr/local/nagios/libexec/check_nrpe -n -t 60 -H <hostname> -c check_load
em vez de
/usr/local/nagios/libexec/check_nrpe -H 10.0.XX.XXX -c check_load -t 30
Então, algo está anexando o "-n" e está causando problemas. O segundo comando retorna o que eu quero, mas o primeiro retorna
CHECK_NRPE: Error receiving data from daemon.
EDIT 2 : Descobri isso, mas não tenho reputação suficiente para apresentá-lo como uma resposta válida, então abaixo está o que eu digitei.
Consegui resolver meu problema. Foi o que eu fiz.
- No Nagios.cfg, liguei o modo de depuração e encontrei o local do arquivo de depuração.
- Replicou o problema ao seguir o log de depuração. Descobri que o comando que o Nagios estava executando era diferente do que eu esperava. Ele estava anexando o sinalizador Sem SSL (-n).
- No commands.cfg, procurei por check_nrpe. Descobri que estava executando o comando com -n. Houve outro comando chamado check_secure_nrpe que executa check_nrpe sem o sinalizador -n.
- Editou minha descrição de serviço para usar check_secure_nrpe em vez de check_nrpe.
- Nagios reiniciados.
O serviço agora funciona como esperado.