Nagios: Dependência de serviço no mesmo host para um host inteiro

5

Eu tenho um sistema Nagios com um grande número de hosts categorizados em diferentes grupos de host. Cada um desses hosts tem dois serviços monitorados, um dos quais é destinado a ser dependente do outro - se service1 for WARNING ou CRITICAL, service2 nesse servidor também não deverá fornecer um alerta. service2 destina-se mais à coleta de estatísticas, enquanto service1 é uma verificação de disponibilidade simples - assim, eu sempre quero a verificação de service2, mas não estou alertando se o service1 está reportando como inativo.

Esta é a minha entrada do services.cfg:

define servicedependency{
    hostgroup                       example-servers
    #host_name                       host1.example.com,host2.example.com
    service_description             service1
    dependent_service_description   service2
    execution_failure_criteria      n
    notification_failure_criteria   u,w,c,o
}

Eu tentei especificá-lo através de um hostgroup e como uma lista de servidores individuais. Idealmente, eu faria isso para todo o grupo de acolhimento em um, em vez de ter que manter constantemente uma lista.

No entanto, isso parece não funcionar, de qualquer forma. Se service1 estiver inoperante, service2 também mostrará um status CRITICAL na tela de problemas e nos detalhes do host.

    
por jreid9001 08.03.2013 / 16:41

2 respostas

0

No manual do Nagios para "execution_failure_criteria": "Se você especificar n (none) como uma opção, a dependência de execução nunca falhará e as verificações do serviço dependente sempre serão ativamente verificadas (se outras condições permitem que seja) ".

Parece que você deveria estar usando "u, c" (não verifique se server1 é UNKNOWN ou CRITICAL). Ou talvez "w, u, c" SE um estado WARNING de service1 também faça com que service2 não seja executado.

    
por 10.03.2013 / 01:10
0

Se você especificar "execution_failure_criteria n", o service2 sempre será verificado. Se estiver marcado e estiver em um estado crítico ou de aviso, a interface do usuário mostrará esse estado. Você não pode evitar isso (afaik), mas pode impedir que ele envie notificações, por exemplo, "notification_failure_criteria u, w, c".

Eu acho que você pode ter "execution_failure_criteria" definido como está (ou seja, "n") e viver com o status mostrando service2 como crítico quando não puder ser alcançado ou alterá-lo para "c".

Você provavelmente não quer suprimir notificações se service1 estiver OK, que é o que você está fazendo com o "o" em "notification_failure_criteria u, w, c, o".

    
por 21.03.2015 / 18:11

Tags