Monitorar serviço de email, com notificação de falha

1

Bom dia,

Atualmente, estou procurando uma solução que permita à nossa organização rastrear falhas no sistema de e-mail (e, em seguida, enviar notificações aos administradores de TI, talvez por SMS, para suporte 24 horas por dia / 7 dias por semana).

Nosso objetivo final é determinar quando o email (como um serviço completo) não está funcionando corretamente. Isso pode ser uma falha em nosso servidor Exchange (2007), como uma falha no firewall ou no filtro de spam, ou como outro ponto de falha "desconhecido". A parte crítica da solução será a notificação confiável da equipe de TI.

Reconhecemos que ter uma solução totalmente à prova de falhas pode ser difícil, mas alguém tem algum conselho para nos orientar na direção certa?

Obrigado

    
por Chris 28.07.2010 / 11:34

3 respostas

2

Como Ig sugere Nagios pode ser parte da solução.

Fora da caixa, ele fará muitas coisas, como medir CPU, portas abertas, sistema respondendo a pings. Mas o importante é que se trata de uma ferramenta de agendamento e relatório - a qual é trivial adicionar novos programas que realmente medem as métricas do sistema. Existem muitos outros produtos para fazer coisas como esta, mas o Nagios é um dos melhores produtos gratuitos (melhor do que muitas das ofertas comerciais). E se você olhar para as ofertas comerciais, passará semanas revendo toda a estratégia de marketing e aproveitará a funcionalidade antes de descobrir se é possível integrar suas próprias métricas, sem falar em como fazê-lo. Certamente, tanto o BMC Patrol (nova versão) quanto o Grid Control da Oracle podem suportar isso - mas exigem muito mais esforço.

Se você quiser testar a funcionalidade de ponta a ponta, tudo que precisa fazer é configurar um trabalho agendado para enviar um email pelo sistema (no Nagios ou com um agendador convencional), digamos, a cada 5 minutos, em seguida, configure uma verificação no Nagios para verificar periodicamente o e-mail mais recente que sai do sistema - se não houver um novo e-mail (ou o e-mail mais recente tiver mais de 6 minutos), o script retornará um status de erro.

Esse tipo de script é trivial para configurar em um sistema Unix, mas pode ser mais difícil (e muito mais caro) em caixas MSWindows - a menos que você tenha uma strong aversão ao Unix, eu recomendaria ativar o Linux ou BSD em um PC de reposição para executar o Nagios e as sondas - mas o Nagios está disponível para o MS Windows.

Parece que seu roteiro está fazendo todo o trabalho pesado? Na verdade, o Nagios gerenciará escalações, poderá ser configurado para enviar alertas para pessoas diferentes dependendo da hora do dia, acionar ações automáticas no caso de um alerta (por exemplo, reinicializar um servidor) e fornecer muitas informações sobre por que o serviço pode estar falhando (por exemplo, disco cheio no servidor de e-mail) e muitas outras coisas ... aproveitam as habilidades existentes para integrar estratégias de resolução de problemas?

C.

    
por 28.07.2010 / 13:10
0

Nagios ou ferramentas semelhantes

    
por 28.07.2010 / 11:47
0

Eu faria a segunda proposta do symcbean.

Configure um trabalho que envie periodicamente um email para alguma caixa de correio de teste (idealmente fora de sua organização, talvez uma conta de correio eletrônico em algum lugar) e, em seguida, faça com que o Nagios o verifique.

Você pode verificar se o e-mail saiu do seu lado ou se chegou (por exemplo, puxando o e-mail pelo POP3). O último obviamente é um teste mais abrangente, mas corre o risco de falhar se o freemailer estiver inativo, então você provavelmente desejará usar dois ou três serviços de freemail.

Se o teste falhar, o Nagios pode alertá-lo de várias maneiras. Você pode enviar um SMS, seja comprando um dispositivo de hardware que se conecta ao servidor Nagios e envia diretamente via GSM, ou através de um serviço web. Este último é provavelmente mais fácil & mais barato, mas falhará se toda a sua conexão de rede estiver inativa.

Lembre-se de não enviar o Nagios pelos alertas; -).

    
por 28.07.2010 / 13:29