Nagios - Não tem certeza de qual intervalo deve ser alterado para limitar o número de vezes que uma notificação é enviada quando ocorre um erro

3

Eu tenho um servidor Nagios que monitora muitos servidores. De tempos em tempos encontramos um erro que não pode ser resolvido no momento e estamos deixando isso por enquanto. Quando isso acontece, continuamos recebendo notificações de e-mail sobre o serviço com falha. Portanto, se não estivermos lidando com o problema no dia seguinte, receberemos cerca de 500 notificações por e-mail relacionadas a ele. Agora minha pergunta é, qual é a diferença entre notification_interval e interval_length e qual valor devo estar editando? Estou disposto a configurá-lo de uma forma que, quando ocorrer um erro, receberei apenas 1 notificação sobre o problema, em vez de receber 10 notificações por hora, por exemplo. Eu quero que o Nagios me envie um e-mail apenas uma vez quando ocorrer um erro e a cada 12 horas até que o erro seja corrigido. Como pode ser alcançado?

    
por Itai Ganot 19.09.2012 / 13:00

2 respostas

4

Você provavelmente deve deixar essas configurações sozinho e usar o recurso reconhecimento no Nagios.

Isso permite que você informe ao Nagios que você sabe sobre o problema e, em seguida, suprime as notificações até que o status seja alterado (isto é, ele piora ou começa a flapear ou o erro desaparece. Nesse caso, os alertas também parar).

Veja Acknowledge_Host_Problem para uma melhor explicação do que isso faz. Desculpe, não consigo encontrar uma página mais atual do que isso, mas explica bem o conceito.

Para responder diretamente à sua pergunta, embora eu ache que haja uma maneira melhor:

  • interval_length é um número de segundos - por padrão, 60
  • notification_interval é o número de intervalos que você deseja entre as notificações. Se você deixou o interval_length sozinho, esse seria o número de minutos entre as notificações.

Para obter 12 horas entre as notificações, você pode definir notification_interval como 720 e deixar interval_length sozinho.

Mas eu ainda acho que a configuração de reconhecimento é melhor porque permite que os Nag ios mantenham nag usando sua equipe até que eles realizem algum tipo de ação.

Observe que, de qualquer forma, o Nagios ainda pode enviar notificações com mais frequência, dependendo do que está acontecendo. Recebi alertas relacionados ao uso da CPU, onde ela oscilava entre acima e logo abaixo do limite crítico - independentemente do que eu fizesse, toda vez que ela passava do limite crítico, um alerta se apagava. A detecção de flapping no Nagios é usada para lidar com essas situações. Ou você pode querer ver seus limites de alerta.

    
por 19.09.2012 / 13:08
1

what is the difference between notification_interval and interval_length

  • interval_length : o número de segundos por "intervalo unitário", padrão o valor é 60
  • notification_interval : o número de "unidades de tempo" a aguardar antes re-notificando

I'm willing to configure it in a way that when an error occurs I will get only 1 notification regarding the issue instead of getting 10 notifications per hour for example.

Defina notification_interval para 0, o Nagios não notificará novamente os contatos sobre problemas para este serviço / host.

I want Nagios to send me an email only once when an error occurs and every 12 hours until the error is fixed.

Se você não alterou o interval_length , basta definir notification_interval para ... 720.

    
por 19.09.2012 / 16:08

Tags