Comparação de sistemas de monitoramento: link
Eu não acho que algum sistema de monitoramento tenha previsão de falhas fora da caixa. Seu papel fornecido é muito acadêmico. Você ainda pode construí-lo na parte superior de algum sistema de monitoramento, que fornecerá dados / eventos / falhas para as previsões do algoritmo de falha.
Alguns sistemas de monitoramento têm:
-
previsão métrica (previsão de tendências). Não é uma previsão de falha. Um simpático artigo semi-acadêmico tem o Zabbix sobre isso - Previsão do Zabbix .
-
detecção de anomalias - mais uma vez, não é uma previsão, é detecção. O mais famoso OSS para detecção de anomalias é o Skyline . Sistemas baseados em RRD (Cacti) usam o algoritmo de Holt Winter Holt Winter . O Graphite também tem algumas funções matemáticas , que podem ser usadas para detecção de anomalias.
Se você quiser implementar / melhorar a detecção de falhas, torne-a genérica:
- camada de entrada - algum conceito de plug-in, portanto, o usuário deve poder usar / escrever o próprio plug-in, o que extrairá dados do sistema de monitoramento específico do plug-in
- camada de detecção de falha - há muitos algoritmos, portanto, cada um deles deve ser configurável
- camada de saída - semelhante à camada de entrada, portanto, o evento sobre a falha prevista pode voltar ao sistema de monitoramento ou a algum outro sistema de alerta
Por favor, torne-o usuário (não acadêmico) amigável e use o Github. Ping me, quando você precisa testá-lo. : -)