Monitorando alertas de e-mail escalonáveis

3

Alguém sabe de uma maneira de monitorar alertas de e-mail de maneira escalável?

Para muitos dos meus serviços no site, eles me mandam um e-mail sobre o sucesso (e o fracasso) de tarefas críticas. A razão pela qual eu recebo e-mail sobre o sucesso é, às vezes, a falha de natureza que o serviço não pode enviar um alerta de falha por e-mail.

Infelizmente, isso não é escalável, agora recebo muitos alertas que realmente não os monitora, mas não posso me dar ao luxo de alertar sobre falhas porque isso não é confiável no passado.

O que eu gostaria idealmente é um serviço de nuvem (ou caixa de correio), algo semelhante ao Pingdom, que eu possa enviar / encaminhar esses alertas também, que enviará um e-mail / sms quando receber um alerta de falha ou estiver faltando alertas de sucesso.

Alguém tem alguma ideia?

    
por Dom 04.12.2012 / 00:16

1 resposta

10

O que você está propondo é reimplementar efetivamente seu sistema de monitoramento (alimentando os alertas do sistema atual em outro sistema de monitoramento que seja inteligente o suficiente para saber que algo está errado se não estiver constantemente seguro de que está tudo bem).

Isso quase certamente não é o que você precisa. O que você precisa é de uma combinação de monitoramento no local e fora do local que enviará a você, de maneira confiável, alertas de falha quando algo falhar (do sistema interno normalmente ou do sistema externo se, por algum motivo, o sistema interno falhou).

Por favor, tenha em mente o seguinte axioma de sistemas de monitoramento:

Não há bons motivos para alertar sobre o sucesso.

Alertar sobre o sucesso é a configuração errada mais comum de um sistema de monitoramento.
Um sistema de monitoramento deve apenas alertá-lo sobre coisas que exigem ação .

O sucesso, por definição, não é um evento que exige ação, portanto nenhum alerta deve ser gerado.
A ausência de sucesso é, por definição, "falha", portanto, um alerta de falha acionável deve ser gerado.

Enviar mensagens de status "está tudo bem", eventualmente, treina as pessoas a ignorar mensagens do sistema de monitoramento (porque nenhuma ação é necessária na maioria das vezes). Você quer que os alertas de monitoramento sejam eventos chocantes que estimulam as pessoas a agir, não perturbações rotineiras que são excluídas de sua caixa de entrada da memória muscular.

    
por 04.12.2012 / 00:45