Qual é a estratégia para detectar desvio de tempo em um data center baseado em Linux?

13

Qual é a estratégia para detectar desvio de tempo em todos os datacenters baseados em linux? Este é um problema mais difícil do que parece a princípio.

O desvio de tempo pode causar sérios problemas para certos aplicativos e, muitas vezes, mesmo que o NTP esteja instalado, é possível falhar pelos seguintes motivos (e muitos mais):

  • O NTP não foi configurado corretamente para reiniciar automaticamente na reinicialização.
  • As configurações em um servidor estão incorretas, portanto, o servidor de horário para o qual ele aponta está inacessível ou inacessível.
  • O servidor de horário principal está inacessível e todos os servidores estão sincronizando com ele agora estão sincronizando com uma fonte não confiável.

Eu gostaria de uma maneira de detectar se todos os servidores individuais estão corretos. Tenha em mente que o servidor com o script / aplicativo de teste pode não estar certo.

    
por Stuart Woodward 02.09.2013 / 03:33

2 respostas

20

Isso é fácil de controlar. Gerenciamento de configuração é a chave ...

Verifique se o serviço ntp está sendo executado e configurado ...

Por exemplo, usando Monit para garantir que ntpd esteja em execução e reiniciá-lo se falhar é uma abordagem fácil ... Pode fazer sentido adicionar o cron e outros daemons essenciais a esse tipo de verificação.

Outra opção é usar uma ferramenta gerenciamento de configuração como Puppet para forçar o mesmo ntpd.conf para seus servidores e garantir que o ntpd esteja instalado, configurado e em execução.

Existem redundâncias suficientes no protocolo NTP para lidar com a instância de um servidor de horário inacessível. Especifique várias fontes.

    
por 02.09.2013 / 03:42
10

Há uma variedade de plugins check_ntp para nagios por aí.

Aqui está uma:

link

Adicione esta verificação ao seu host nagios e receba alertas se algo der errado.

    
por 02.09.2013 / 03:39