verificação de serviço nagios

3

Sou novo no nagios e temos um pequeno problema com o qual preciso pedir ajuda. Muitas das máquinas que monitoramos podem não responder um pouco quando algumas tarefas muito intensivas de cpu são executadas. Isso faz com que nagios enviem avisos e alertas enquanto esses hosts estão ocupados relatando coisas como 'tempo limite de ping' ou 'processos zumbis' e até trocam avisos de espaço, mas na verdade não há nenhum problema.

Existe uma maneira de configurar nagios para não enviar tais alertas, mas verificar x número de vezes durante um período de tempo e só então enviar um alerta no final desse período se o servidor em questão não tiver se recuperado? / p>

Olhando para o arquivo commands.cfg, vejo entradas como esta:

define command{
        command_name    check_local_swap
        command_line    $USER1$/check_swap -w $ARG1$ -c $ARG2$
        }

Como eu poderia modificar este exemplo para realizar o que eu quero acima?

Obrigado

    
por DRH 01.09.2012 / 00:42

2 respostas

3

Primeiro, você pode alterar os parâmetros da (s) verificação (s) em questão, ajustando a (s) diretiva (s) check_command :

Por exemplo:

    check_command           check_nrpe!check_zombie_procs!1 5

Se você quiser tolerar mais processos zumbis, basta aumentar os números.

Depois de ajustar os limites ao seu gosto, você poderá remover alertas espúrios aumentando max_check_attempts .

Por exemplo:

max_check_attempts      3

Isso permite que o host / serviço insira um estado "não-OK" "soft" pendente de duas verificações adicionais; você será alertado no terceiro.

Veja também: Tipos de estado do Nagios , Definições do objeto Nagios

    
por 01.09.2012 / 00:59
2

Acho que você pode estar falando sobre o problema do "flapping".

Confira esta página sobre como lidar com flapping sob Nagios :

    
por 01.09.2012 / 00:59

Tags