Pressione os dados de monitoramento do Nagios / Zenoss para outro sistema

1

Eu construí um sistema que faz vários tipos de análise de séries temporais e agora gostaria de alimentá-los com uma ferramenta de monitoramento. Como já tenho o Nagios configurado no meu ambiente de teste, prefiro obtê-lo de lá. Mas, como segunda opção, eu poderia ter acesso a uma instância do Zenoss de teste e apreciaria também as respostas para o Zenoss.

O que eu quero

Eu quero séries temporais para vários KPIs em vários dispositivos.

Idealmente, eu seria capaz de especificar o formato dos dados, mas contanto que contenha as informações que eu preciso, fico feliz em transformá-los no recebimento. A informação que eu preciso é apenas

  • O identificador do dispositivo, por ex. 10.2.42.2 ou Ubuntu-42A
  • O componente que está sendo monitorado, e. CPU ou Memória
  • O KPI, por exemplo % de uso , KBytes disponíveis
  • O valor do KPI
  • O registro de data e hora

Finalmente, gostaria de enviar os dados via HTTP (por enquanto, depois via HTTPS).

Eu já posso fazer isso no caso de um alerta - por exemplo, quando um limite é violado eu sei como configurar o Nagios para chamar um script simples meu com o IP do dispositivo, etc. como parâmetros - e meu script executa o HTTP pedido. Mas eu não vi como isso pode ser configurado para disparar em todas as pesquisas .

O que eu não quero

Não quero dados de alerta, quero as séries temporais brutas.

Eu não quero pesquisar o Nagios para obter esses dados - os intervalos de pesquisa variam e eu gostaria de evitar tráfego de rede desnecessário.

Eu verifiquei esta questão mas que parecia enviar dados de nós escravos Nagios para um nó mestre Nagios .

    
por Rohit Chatterjee 01.08.2013 / 07:38

2 respostas

0

Você pode fazer isso com as peças destinadas ao monitoramento distribuído.

Por exemplo, use um comando ocsp para enviar todos os resultados da verificação em outro lugar. O comando def pode apontar para um script que empurra perfdata via curl ou similar.

    
por 01.08.2013 / 22:31
0

Em nagios.cfg , adicionamos

  • obsess_over_services=1
  • ocsp_command=OUR_COMMAND_NAME

Em seguida, definimos o novo comando em commands.cfg :

  • command_name OUR_COMMAND_NAME
  • command_line /path/to/our/script

O script recebe os seguintes parâmetros:

  1. Nome do host
  2. Descrição do serviço
  3. Estado do serviço
  4. Mensagem do plug-in relevante

Referindo-me à minha pergunta: o dispositivo que eu queria era esse nome de host e o componente & O KPI pode ser extraído da descrição do serviço e da mensagem do plug-in.

No entanto, preciso fazer um pequeno trabalho de análise para obter esses valores, uma vez que a mensagem do plug-in é escrita mais para humanos do que para máquinas, por exemplo.

OK - 1.05 GB used (1.05 GB RAM + 0.00 GB SWAP, this is 32.4% of 3.24 GB RAM)

mas pelo menos o formato é consistente, então não estou reclamando.

    
por 07.08.2013 / 06:03

Tags