Definir temporário check_interval na verificação do serviço Nagios

2

Alguém sabe se o Nagios tem uma opção para definir uma configuração check_interval temporária em uma verificação de serviço e tê-la revertida após um X minutos?

Minha definição de verificação de serviço é assim:

define service {
    host_name prodhost
    use http
    service_description www.example.com:8080
    check_command check_http!8080!example.com:8080!/!5.000!10.00
    servicegroups http-check
    check_interval .5
    retry_interval .25
    max_check_attempts 3

}

O problema é que toda vez que alterações são feitas no meu aplicativo da web (por meio de um IC), também é necessário reiniciar o aplicativo como parte do processo de implantação. Que aciona alguns dos meus alertas de 5 segundos e 10 segundos e alertas críticos.

Eu gostaria de poder manter meus limites atuais de check_interval , retry_interval e max_check_attempts intactos, mas ser capaz de alterar temporariamente -los sempre que uma implantação é feita e tê-lo voltar ao seu estado original após 3 minutos.

    
por Alpha01 22.09.2015 / 20:39

1 resposta

1

O que você está se referindo é Monitoramento adaptativo . Não é necessariamente a melhor maneira de atingir seu objetivo, mas você pode alterar esses parâmetros com comandos externos. Por exemplo, você pode enviá-los remotamente por meio de um script que se conecta usando ssh com chaves.

(Devido aos seus intervalos de um minuto, serão necessários alguns ajustes para acertar o tempo, pois o Nagios pode não ter processado o comando ainda antes de sua próxima verificação ser executada.)

Você teria seu fluxo de trabalho de implantação enviando um comando ao Nagios para modificar os parâmetros e, em seguida, envia outro para alterá-los novamente depois que o serviço for reiniciado. Da mesma forma, você pode desativar as verificações ou notificações ativas, temporariamente.

O que você provavelmente deve fazer em vez disso é (automaticamente) colocar o (s) serviço (s) em tempo de inatividade programado , através do processo de implantação. O tempo de inatividade tem o benefício de ter um horário de término / parada, portanto, você não precisa enviar um segundo comando para reverter suas alterações.

    
por 23.09.2015 / 05:24