Timeout do soquete esporádico check_ntp_time do Nagios

2

Check_ntp_time falhou em todos os meus hosts esporadicamente. Eu costumo receber

CRITICAL - Socket timeout after 10 seconds

E alguns minutos depois, o check_ntp_time é bem-sucedido e mostra o deslocamento correto

NTP OK: Offset 0.0001899003983 secs

Eu tentei aumentar o tempo limite do comando check_ntp_time para 20 segundos, mas ele falha na mesma taxa. Eu tentei remover nopeer e noquery do ntp.conf sem sucesso (o que faz sentido porque falharia 100% do tempo se esse fosse o problema). O fato de que está falhando em momentos aleatórios e sucedendo logo depois é realmente me jogando fora. Vale a pena notar também que ele não falha para todos os hosts ao mesmo tempo, ele geralmente falha entre 1 a 3 hosts por vez. Alguma ideia do que poderia estar causando isso?

Meu comando check_ntp_time é assim:

define command{
    command_name    check_ntp_time
    command_line    $USER1$/check_ntp_time -H pool.ntp.org -t 20 -w 1 -c 3
    }

EDIT:
    Métrica Mín. Max. Média de vendas     Verificar o tempo de execução: 0,00 seg 20,00 seg 1.153 seg     Verificar a latência: 0,00 seg 0,00 seg a 0,000 seg     Porcentagem de mudança de estado: 0,00% 31,84% 0,86%

2 cheques por segundo (0,5 por CPU)

    
por Charlie Wilson 11.09.2015 / 18:42

2 respostas

0

Isso foi resolvido alterando o servidor ntp que eu configurei para verificar a hora correta. É provável que todos os servidores o tenham consultado ao mesmo tempo e bloqueou algumas solicitações. Acabei apontando para um servidor ntp interno que está tomando seu tempo da fonte usada anteriormente.

    
por 28.09.2015 / 20:02
1

É porque a verificação tenta se conectar ao IPv6 com metade do tempo limite especificado por '-t' e, em seguida, volta para o IPv4. Assim, você pode diminuir o tempo limite para 10 segundos e receber uma resposta em 5 segundos:

[root@server ~]# time /usr/lib64/nagios/plugins/check_ntp_time -q -H time1.google.com -w 1 -c 2 -t 10
NTP OK: Offset 0.0004314184189 secs|offset=0.000431s;1.000000;2.000000;

real    0m5.767s
user    0m0.843s
sys     0m4.908s

Ou você pode usar o IPv4 somente por '-4', então você receberá uma resposta em < 1 seg:

[root@server ~]# time /usr/lib64/nagios/plugins/check_ntp_time -q -H time1.google.com -4 -w 1 -c 2 -t 10
NTP OK: Offset 0.0006598234177 secs|offset=0.000660s;1.000000;2.000000;

real    0m0.401s
user    0m0.003s
sys     0m0.007s
    
por 25.09.2018 / 22:56

Tags