Nagios CHECK_NRPE: Erro ao receber dados do daemon. RHEL 6

1

Então, estou tentando configurar um serviço Nagios check_load em um servidor Red Hat. Eu segui a documentação da Red Hat para instalar o cliente NRPE: link

Na GUI do Nagios, eu entendo isso:

CHECK_NRPE: Error receiving data from daemon.

Mas quando eu logar no servidor Nagios para depurar, parece que posso executar esta multa a partir do terminal:

root@portalmon:/Nagios# /usr/local/nagios/libexec/check_nrpe -H 10.0.XX.XXX -c check_load -t 30
OK - load average: 0.15, 0.10, 0.04|load1=0.150;15.000;30.000;0; load5=0.100;10.000;25.000;0; load15=0.040;5.000;20.000;0;

Então, não acho que seja um problema de permissão. Acho que é algum tipo de problema de caminho, mas não consigo entender por que isso não está funcionando. Alguém pode ajudar?

Aqui está minha descrição de serviço:

define service{
  use                 dev-service
  host_name           [DEV] Luminis Admin DEV Portal
  service_description CPU-Load
  check_command       check_nrpe!"check_load"
}

Gostaria de saber se estou ligando para o mesmo serviço quando executo o comando do terminal acima.

EDIT : Eu descobri a questão. Agora trabalhando na resolução. Eu mudei o Nagios para o modo de depuração e olhando para /usr/local/nagios/var/nagios.debug eu percebi que o comando que estava sendo executado era

/usr/local/nagios/libexec/check_nrpe -n -t 60 -H <hostname> -c check_load

em vez de

/usr/local/nagios/libexec/check_nrpe -H 10.0.XX.XXX -c check_load -t 30

Então, algo está anexando o "-n" e está causando problemas. O segundo comando retorna o que eu quero, mas o primeiro retorna

CHECK_NRPE: Error receiving data from daemon.

EDIT 2 : Descobri isso, mas não tenho reputação suficiente para apresentá-lo como uma resposta válida, então abaixo está o que eu digitei.

Consegui resolver meu problema. Foi o que eu fiz.

  1. No Nagios.cfg, liguei o modo de depuração e encontrei o local do arquivo de depuração.
  2. Replicou o problema ao seguir o log de depuração. Descobri que o comando que o Nagios estava executando era diferente do que eu esperava. Ele estava anexando o sinalizador Sem SSL (-n).
  3. No commands.cfg, procurei por check_nrpe. Descobri que estava executando o comando com -n. Houve outro comando chamado check_secure_nrpe que executa check_nrpe sem o sinalizador -n.
  4. Editou minha descrição de serviço para usar check_secure_nrpe em vez de check_nrpe.
  5. Nagios reiniciados.

O serviço agora funciona como esperado.

    
por RommelTJ 31.07.2014 / 00:28

2 respostas

2

Consegui resolver meu problema. Foi o que eu fiz.

  1. No Nagios.cfg, liguei o modo de depuração e encontrei o local do arquivo de depuração.
  2. Replicou o problema ao seguir o log de depuração. Descobri que o comando que o Nagios estava executando era diferente do que eu esperava. Ele estava anexando o sinalizador Sem SSL (-n).
  3. No commands.cfg, procurei por check_nrpe. Descobri que estava executando o comando com -n. Houve outro comando chamado check_secure_nrpe que executa check_nrpe sem o sinalizador -n.
  4. Editou minha descrição de serviço para usar check_secure_nrpe em vez de check_nrpe.
  5. Nagios reiniciados.

O serviço agora funciona como esperado.

    
por 31.07.2014 / 17:17
0

Sua resposta ajuda muito, obrigado.

Existe outra solução. Você pode editar objects/commands.cfg e remover -n do comando check_nrpe .

Dessa forma, você pode continuar usando check_nrpe em vez de check_secure_nrpe

    
por 21.03.2016 / 05:40

Tags