Defina diferentes limites de aviso para o Nagios nos finais de semana

1

Estou usando o Nagios para monitorar o uso da CPU em meus servidores com o check_load plugin.

Nos fins de semana, temos alguns trabalhos em lote em execução e praticamente não há usuários reais, portanto, gostaria de ter um limite de aviso um pouco maior.

Eu vi soluções para desativar completamente as notificações durante esses períodos, mas gostaria de receber notificações se a carga ficar muito alta.

Também vejo soluções para definir dois serviços, um para o dia da semana e outro para o final de semana, mas gostaria de manter a carga da CPU em um único gráfico durante toda a semana.

Alguma idéia ou exemplo de como posso ter limites diferentes em um único serviço?

    
por Gene Vincent 25.09.2014 / 12:11

2 respostas

1

A maneira de fazer isso depende de onde seus limites estão definidos. Se eles estiverem definidos no host que está sendo verificado, por exemplo, codificados em nrpe.cfg, será necessário manter duas cópias de nrpe.cfg e rotacioná-las em um agendamento. (E reinicie o NRPE toda vez que ele trocar.) Isso pode ser feito com um cron job e um script simples.

Se você tem NRPE aceitando args e está passando os limites como ARG1, ARG2, etc., do final do Nagios, você tem algumas opções.

Você pode definir dois serviços quase idênticos, com períodos de verificação diferentes / não sobrepostos e diferentes limiares passados como argumentos.

Ou você pode usar um serviço e alterar dinamicamente os argumentos de limite. É complicado, mas pode ser feito. Chama-se Monitoramento adaptativo .

A idéia básica é enviar comandos externos em um agendamento para alterar as configurações do objeto. No seu caso, você deseja alterar o check_command para passar em diferentes limites. Algo como ... altere check_nrpe!check_load!5 10 para check_nrpe!check_load!15 30 ou similar.

Para o monitoramento adaptativo, o que você está procurando são os comandos externos que começam com "CHANGE" no comando listar , especificamente CHANGE_SVC_CHECK_COMMAND neste caso.

    
por 25.09.2014 / 17:14
0

Eu tenho olhado para isso no passado e parece que não há solução embutida (eu posso estar errado!).

O que acabei fazendo foi criar dois arquivos de configuração diferentes para o serviço, depois adicionei um cron job que executava todas as sextas e domingos à noite para trocar os dois arquivos e recarregar os nagios (service nagios reload).

A troca pode ser feita, por exemplo, renomeando o arquivo cfg que não deve ser usado, já que o nagios somente lerá arquivos terminados em .cfg

Uma solução mais elegante seria apenas alterar o valor do arquivo usando sed

    
por 25.09.2014 / 15:59