Pergunta / TLDR;
Existe um Sensu -alternative (ou seja, agente / servidor de monitoramento do sistema operacional baseado no RabbitMQ) que define seus limites de alarme no servidor de monitoramento central e não no servidor cliente monitorado (como o Sensu e o Nagios)?
O RabbitMQ é obrigatório, então não há Zabbix et al.
Histórico:
Tenho ambientes grandes (Windows e RHEL) nos quais não posso instalar ferramentas de orquestração (Puppet et al), e a quantidade de serviços instalados deve, portanto, ser mínima.
Estou pesquisando se poderia desenvolver um único agente que coleta informações do sistema, retransmite logs (para o Logstash) e gera relatórios sobre o consumo de recursos.
Ele levaria todos esses valores para o RabbitMQ e, em seguida, o Logstash poderia assinar os logs, um serviço de monitoramento poderia assinar as métricas de recursos (e criar alarmes a partir deles), um sistema do CMDB poderia assinar as informações do sistema etc.
No entanto, eu gostaria apenas de receber as informações sobre o consumo de recursos e criar os alarmes no servidor de monitoramento e não precisar alterar os limites em cada servidor para alterar o limite de alarme.
Eu não posso ser a única pessoa a encontrar um agente assim útil ...
Esclarecimento:
Se um servidor sob o Monitoramento Sensu estiver sem disco, o agente Sensu verifica o espaço em disco, compara-o com o limite CRITICAL definido nesse servidor e, se o limite for passado, um CRITICAL O alarme é enviado através do RabbitMQ para o servidor de monitoramento central.
Para alterar o limite sem Puppet ou algo assim, é necessário fazer login no servidor (certo?)
A maneira que eu gostaria que isso funcionasse é que quando um agente de monitoramento verifica seu espaço em disco, ele apenas envia a quantidade de disco disponível (ou disco usado e total etc) através do RabbitMQ para o servidor central que então compara esse valor com o limite definido no servidor central e, se necessário, envia um alarme.
Se o limite precisar ser alterado, ele será alterado no servidor central ou vários valores de vários servidores poderão ser comparados para criar um alarme.
Este é o meu principal problema com o Sensu, embora eu entenda a decisão de compatibilidade com o Nagios.
Também seria preferível se nenhum servidor central - > o tráfego do servidor monitorado seria necessário. Eu suponho que um kludge poderia ser feito quando o servidor central envia os limites para o agente que os executa como "local". A rede para o ambiente torna isso excepcionalmente complicado.
Obrigado por qualquer ideia que alguém possa ter!