Existe um sistema de gerenciamento de incidentes / ingressos gratuito que me ajudará a alcançar o seguinte?
1) Se um serviço ficar inativo, o Nagios alerta a equipe de serviço e envia o status para algum back-end ou DB como um ticket, digamos que o status inicial é "New"
.
2) A equipe de plantão faz o login através de um frontend e reconhece o novo ticket marcando-o como "In progress
", então agora o status do ticket muda de "New"
para "In progress"
.
3) Se, mesmo após "n" minutos, nenhuma pessoa da equipe em serviço tiver alterado o status do ticket para "In progress"
, o Nagios alertará o próximo nível de contatos. Embora se a equipe em serviço tenha reconhecido o ticket, não há necessidade de alertar o próximo nível.
4) Quando o serviço aparece, o Nagios fecha o ticket marcando " Closed"
Agora eu já tenho o Nagios monitorando configurado e atualmente ele alerta enviando mensagens de texto e e-mails, o que estou procurando é algum framework que só escalona o problema (alerta o segundo nível) se o primeiro nível (em serviço) pessoal) não responde ao alerta inicial.
Por "responder ao alerta", a equipe em serviço pode fazer login por meio de algum frontend e basicamente alterar o status para algo como "Acknowledged"
ou "In progress"
.
Tags monitoring nagios