Na definição do alerta, você pode definir o intervalo de reenvio para cada 'x' minuto e quantos e-mails enviar antes de desistir.
Eu tenho um APC Smart-UPS 3000 com um cartão de gerenciamento (acredito que seja um AP9617).
Então, ontem à noite, fiz um teste automático de autoteste semanal. O teste falhou, alegando que eu tenho pelo menos uma bateria com falha:
Dec 27 21:19:10 10.16.15.50 UPS: Started a self-test. 0x0137
Dec 27 21:19:12 10.16.15.50 UPS: At least one faulty battery exists. 0x0119
Dec 27 21:19:28 10.16.15.50 UPS: Failed a self-test. 0x0106
O cartão de gerenciamento obedientemente me enviou dois e-mails para me informar sobre isso: um que o teste falhou e outro que me disse que eu tinha uma bateria defeituosa.
O problema é que, a cada dois minutos desde então, ele me enviou os mesmos dois e-mails. Os registros do dispositivo implicam que os testes não estão sendo executados constantemente, então parece que esse é algum tipo de alerta que precisa ser limpo ou reconhecido.
De acordo com os registros do meu servidor de e-mail, esses e-mails estão sendo gerados pelo cartão de gerenciamento - eles não estão presos ou em loop de alguma forma em meus sistemas de e-mail.
Está começando a incomodar o cara de plantão. Agora posso desativar a notificação por e-mail, mas isso acaba com o propósito de tê-la.
Então alguém sabe como fazer isso parar? Idealmente sem ter que entrar (já que são as férias) ou desligá-lo (há coisas conectadas a ele por uma razão).
Obrigado.
Não há nenhuma opção de confirmação para o alerta. Você continuará recebendo os alertas por e-mail, desde que a condição exista (a bateria precisa ser substituída). O que você pode fazer nesse meio tempo é desabilitar a ação de alerta por email para eventos de Aviso e Grave ou desabilitar o destinatário.
Para qualquer pessoa que pesquisar a resposta:
Siga o assistente para definir o email ou a frequência do trap para algo mais sensato aqui.
Eu não estou no local e, por isso, não posso entrar no nosso Symmetra UPS no momento para verificar as configurações, mas já vi isso antes.
Você pode desativar o alerta para esse evento (não precisa fazer isso para tudo) ou simplesmente aumentar a taxa de novo alarme para algo mais longo, digamos 60 minutos.
No GUI da Web para Logs..Syslog..Settings, parece haver configurações para "Geração de mensagem: Ativar" e também "Mapeamento de gravidade", que podem silenciar ou fazer downgrade de alertas.
Eu tive alguns problemas com os cartões de gerenciamento da APC. Descobri que algumas opções para configurar alertas são configuráveis somente a partir da interface telnet. E há alguns eventos nos quais você não pode controlar os alertas, como quando uma voltagem baixa de entrada se corrige. Você pode dizer para não alertá-lo quando você entrar nessa condição, mas não quando a condição se corrigir. O que é irritante se você estiver em um prédio antigo que diz que um compressor para um AC dispara as quedas de voltagem por 1 segundo, resultando em alguns e-mails por dia. Mudei meu monitoramento e alerta para usar o SNMP e o Nagios para solucionar os problemas da APC.
Na página da web do aplicativo "Smart-UPS / Matrix" da APC "UPS Network Management Card 2":