Como você monitora um servidor de monitoramento?

14

Portanto, executamos o Groundworks (com o Nagios) no CentOS para monitorar nossos vários servidores e processos. Eu tenho a configuração para enviar automaticamente e-mails e textos SMS quando as coisas atingem um estado de AVISO ou CRÍTICO. Normalmente isso funciona perfeitamente. No entanto, duas vezes tivemos problemas com o Postfix no servidor em que o Postfix decidiu parar de enviar e-mail. O tempo mais recente durou 4 dias porque nenhum de nós notou.

Isso me leva a uma pergunta importante: como devo monitorar meu servidor de monitoramento?

    
por organicveggie 05.12.2010 / 22:22

6 respostas

12

Com um segundo servidor de monitoramento, é claro. O segundo pode ser muito mais simples, já que tudo o que precisa fazer é monitorar o primeiro. E deve ser monitorado pelo sistema de monitoramento principal, por sua vez, é claro.

Se o seu grupo fizer parte de uma organização maior com infraestruturas de TI separadas, você poderá organizar o serviço de monitoramento de outro grupo para assistir ao seu.

Você também pode garantir que o servidor envie uma mensagem "está tudo bem" todos os dias e tenha o hábito de procurá-lo. (Isso só é eficaz se você não estiver sobrecarregado com mensagens de rotina, é claro).

    
por 05.12.2010 / 22:40
14

Outras pessoas sugerem o envio de mensagens regulares dizendo que as coisas estão bem, mas pessoalmente eu não concordo com isso. O monitoramento deve permanecer em silêncio, a menos que haja um problema, e nunca confie em um usuário que perceba que algo está errado, como "Ah, não recebi esse e-mail diário em alguns dias". Especialmente se você tiver mais de uma pessoa respondendo a alertas, cada um pode pensar que o outro já removeu a mensagem diária "Estou bem".

Temos um serviço externo (dos quais existem centenas, mas usamos wormly ) para fazer verificações HTTP de nossos servidor de monitoramento para ter certeza de que está funcionando e pode alcançar a Internet. Essa é a nossa principal preocupação em monitorá-lo. Então nosso servidor Nagios monitora todos os nossos servidores Nagios de clientes.

Mas, você traz um bom ponto. Provavelmente, devemos adicionar um URL HTTP que verifique a fila do postfix e, se ela mostrar um número incomum de mensagens, o que provavelmente significa que tem qualquer na fila e, em seguida, crie um alerta. Outra opção seria usar métodos diferentes para alertas, por exemplo, um agente de entrega de SMS não SMTP, bem como SMTP que usamos atualmente.

No nosso caso, porém, não me lembro de termos tido o servidor de correio eletrônico morto. É claro que todo esse servidor de e-mail é usado para enviar alertas do Nagios, então a configuração é muito simples e quase nunca muda.

    
por 05.12.2010 / 23:41
5

Obviamente, o seu postfix também deve ser monitorado, mas isso é outro tópico;)

Eu uso o plug-in do verificador Nagios para o Firefox , ele está sempre sendo executado em uma barra de status em qualquer computador que eu uso regularmente .

Além disso, eu tenho um script personalizado no host externo que pinga o host nagios e envia o SMS se ele não estiver respondendo aos pings.

Até agora (5+ anos) funcionou bem (bater na madeira).

    
por 05.12.2010 / 22:37
2

Para monitorar o monitoramento do servidor (nagios no nosso caso), o plano básico ou gratuito do Pingdom ou do alertfox funciona muito bem.

    
por 10.12.2010 / 23:33
1

Primeira coisa: deixe-me enviar mensagens "Estou vivo" uma ou duas vezes por dia. Em segundo lugar, eu corro uma máquina antiga apenas para esse fim, que tem outro modem GSM, uma pequena UPS, etc. e uma conexão dedicada (direta) ao servidor de monitoramento primário. Este também ajuda no ponto três: verifique o status de seus sistemas de monitoramento regularmente. O pequeno sistema de monitoramento auxiliar exibe a página de status do sistema primário no meu escritório o tempo todo.

    
por 05.12.2010 / 22:38
1

Se o seu servidor de monitoramento estiver acessível pela Internet, ele deverá ser monitorado por um provedor externo (por exemplo, websitepulse et al.).

    
por 22.12.2010 / 12:51