Nagios 'excluir' diretiva não exclui prazos

1

Eu tentei configurar minha instalação nagios para verificar a disponibilidade de um serviço SMTP fora de suas horas de backup. Infelizmente, parece estar ignorando essa configuração:

# a timeperiod to check only outside of zimbra's backup hour
# (combining the first with the second timeperiod)
define timeperiod {
    timeperiod_name     zimbra-backups
    alias               When zimbra is being backed up
    sunday              04:00-05:00
    monday              04:00-05:00
    tuesday             04:00-05:00
    wednesday           04:00-05:00
    thursday            04:00-05:00
    friday              04:00-05:00
    saturday            04:00-05:00
}
define timeperiod {
    timeperiod_name     always-except-zimbra-backups
    alias               24x7 except backup time
        sunday          00:00-24:00
        monday          00:00-24:00
        tuesday         00:00-24:00
        wednesday       00:00-24:00
        thursday        00:00-24:00
        friday          00:00-24:00
        saturday        00:00-24:00
    exclude             zimbra-backups
}

O que, então, é usado com um novo host:

define host {
    host_name               mailserver-except-backups
    alias                   mail server (outside backup hours)
    address                 yaddayadda
    notification_options        d,u,r,f
    use                     my-default-host
    check_period            always-except-zimbra-backups
    }
define service {
    host_name                   mailserver-except-backups
    service_description         SMTP service
    check_command               check_smtp!-t 30
    use                         my-default-service
    check_interval              2
    retry_interval              1
    }

Eu não consigo ver o que há de errado ... alguma pista? Aqui está um dos e-mails de notificação

***** Nagios *****

Notification Type: PROBLEM

Service: SMTP service
Host: mail server (outside backup hours)
Address: yaddayadda
State: CRITICAL

Date/Time: Sat Apr 27 04:03:16 CEST 2013

Additional Info:

Connection refused

Nagios é o Core 3.3.1 rodando em um OpenBSD 5.2.

    
por lorenzog 27.04.2013 / 11:13

3 respostas

1

As verificações de host e as verificações de serviço são quase totalmente não relacionadas, exceto por uma dependência implícita do serviço em seu host associado.

Você configurou a verificação de host para o seu período de tempo personalizado, mas a verificação de serviço está usando o check_period definido no modelo que está usando. Adicione um check_period à sua definição de serviço para corrigir isso.

Como alternativa, você pode usar seu período de tempo personalizado como um notification_period para o serviço, se quiser apenas suprimir as notificações durante o backup.

Além disso, não que as exclusões possam ser quebradas em 3.3.x , conforme observado nesta linha do Histórico da versão do Nagios em 3.2.0:

Known issue: Service checks that are defined with timeperiods that contain "exclude" directives are incorrectly re-scheduled. Don't use these for now - we'll get this fixed for 3.4

... então você pode querer atualizar para 3.4.x ou 3.5.0 (mais recente no momento em que este documento foi escrito).

    
por 30.04.2013 / 20:16
0

Não posso testá-lo agora, mas acho que check_period do serviço é herdado de my-default-service e substitui check_period da definição do host.

E também acho melhor suprimir apenas as notificações nesse intervalo.

    
por 29.04.2013 / 12:25
-1

Talvez você deva alterar apenas o notification_period . Você ainda receberá um aviso no frontend do nagios, mas nenhuma notificação será acionada durante essas horas.

    
por 02.05.2013 / 10:05