O nagios do Acelerador alerta se o host perde a conectividade

6

Usamos nagios para monitorar nosso farm de servidores e geralmente funciona muito bem. De tempos em tempos, porém, o host em que o nagios é executado perde a conectividade por alguns minutos, o que faz com que os nagios acreditem que todos os servidores e serviços monitorados estejam inativos. O resultado são centenas de emails de alerta, logo seguidos por centenas de emails de recuperação.

Existe alguma maneira de configurar o nagios de forma a testar sua própria conectividade antes de liberar uma avalanche de mensagens de alerta?

    
por Benjamin Wohlwend 19.06.2012 / 08:58

1 resposta

6

Sim, você pode definir pais e filhos. Se um pai estiver inativo, nenhuma notificação sobre o filho será dada. Você precisa definir os tempos corretamente (em generic_service e generic_host ou nos modelos que você usa), porque quando os serviços não estão mais disponíveis, ele precisa ter decidido que o pai está inativo antes de enviar notificações para esses serviços. / p>

O que eu fiz é isso:

# ISP gateway (first in traceroute)
define host {
        host_name   kpn-gateway
        alias       KPN Gateway
        address     1.2.3.4
        use         generic-host
        notification_period  never
        parents     experia
}

# gateway in datacenter
define host {
        host_name   duocast-gateway
        alias       Duocast gateway
        address     5.6.7.8
        use         generic-host
        parents     kpn-gateway
        contact_groups bla
}

# one of the hosts in datacenter.
define host {
        host_name   brick
        alias       host.example.com
        address     a.b.c.d
        use         generic-linux-host
        parents     duocast-gateway
        contact_groups geborsteldstaal
}
    
por 19.06.2012 / 09:10

Tags