escaladas Nagios, escalação crítica prematuramente após aviso

5

No Nagios 3, gostaria que um serviço fosse escalonado depois de passarem por XX minutos críticos. Funciona muito bem em serviços que vão de UP a CRITICAL. No entanto, se o serviço tiver advertido > XX minutos (digamos, quanto ao espaço em disco que está lentamente subindo) e se tornar crítico, a primeira falha será o desencadeamento de um escalonamento. Ele está contando os avisos para a contagem de escalonamento, onde, como queremos, ele falha após três alarmes CRÍTICOS, não com três avisos e um crítico.

Existe uma solução que me permita ignorar os avisos que contam para o escalonamento da verificação de serviço?

Aqui está um exemplo de outro usuário com o mesmo problema - e configurações muito semelhantes. link )

    
por Matt Simonsen 02.08.2014 / 00:39

1 resposta

1

Como não uso escalonamentos em minha implementação de Nagios , falarei cegamente, apenas em relação à documentação para a definição de escalonamento de serviços .

Você pode ter que considerar a diretiva first_notification :

first_notification: This directive is a number that identifies the first notification for which this escalation is effective. For instance, if you set this value to 3, this escalation will only be used if the service is in a non-OK state long enough for a third notification to go out.

E também considere a diretiva escalation_options :

escalation_options: This directive is used to define the criteria that determine when this service escalation is used. The escalation is used only if the service is in one of the states specified in this directive. If this directive is not specified in a service escalation, the escalation is considered to be valid during all service states. Valid options are a combination of one or more of the following: r = escalate on an OK (recovery) state, w = escalate on a WARNING state, u = escalate on an UNKNOWN state, and c = escalate on a CRITICAL state. Example: If you specify w in this field, the escalation will only be used if the service is in a WARNING state.

Então, para conseguir o que você quer (escalação após 3 alarmes CRÍTICOS), eu tentaria uma definição como essa:

define serviceescalation{
    host_name              myhost
    service_description    Disk Usage
    first_notification     3
    last_notification      0
    notification_interval  10
    contact_groups         admins
    escalation_options     c,r
    }

Espero que ajude ... e trabalhe ...!

    
por 02.08.2014 / 15:48