Parece que este seria um bom caso para utilizar o sistema de dependências do Nagios. Faça todas as centenas de verificações dependentes deste check_nrpe, e isso deve suprimir todas as notificações estranhas.
Estou monitorando um serviço via check_nrpe para centenas de caixas. Sempre que este serviço vai mal, normalmente cada caixa fica ruim e é inundada com notificações / mensagens de texto.
Alguma sugestão sobre como ou o que usar para colocar tudo isso em uma única verificação?
Parece que este seria um bom caso para utilizar o sistema de dependências do Nagios. Faça todas as centenas de verificações dependentes deste check_nrpe, e isso deve suprimir todas as notificações estranhas.
Além das outras boas sugestões, se você realmente quer literalmente criar uma nova verificação adicional que é acionada quando qualquer um dos conjuntos de verificações é disparado, tente check_service.pl link .
Se esse for o caso, primeiro verifique se você está monitorando a coisa certa. Se, por exemplo, o problema é que um switch falha e tudo o que você está fazendo é monitorar os hosts conectados a ele, você receberá vários alertas de host down. Segundo uso dependências. Isso permite que o nagios o notifique sobre a falha do switch e ignore todos os alertas do host por trás dele.
Tags monitoring nagios