Como você lida com um grande volume de mensagens do cron (de mil servidores) de uma maneira inteligente? Caso de uso principal: um erro cron vem, mas sua gravidade não garante uma ação imediata. No entanto, eu não quero um e-mail sobre isso a cada dois minutos. Obviamente eu poderia silenciá-lo, mas depois vou esquecer o erro.
Erro de amostra: um unattended-upgrades
periódico falhou porque não havia memória suficiente disponível.
Idealmente, eu usaria um serviço Opbeat ou Sentry, mas para a saída cron. Isso me permitiria agregar (no servidor e no comando), atribuir e silenciar incidentes.
Mas esperamos que alguém já tenha implementado algo inteligente.
Obrigado pelas suas sugestões!
Atualização: encontrei um link sentry-cron
utility @ que parece fazer o que eu quero. Para o Opbeat isso também é possível, mas ninguém escreveu um wrapper ainda.
Tags cron scalability