Escrevendo o reconhecimento do serviço nagios para o arquivo do sistema

2

Eu uso strongmente o nagios para monitorar muitos servidores e serviços e confiar nele diariamente. A partir de agora, todos os serviços são gravados no log do sistema (atualmente, o CentOS 6.9) e os administradores do sistema são notificados quando os serviços estão falhando. No entanto, os serviços que foram confirmados ainda gravam no log do sistema e, portanto, estou constantemente sendo notificado por serviços que já reconheci. Existe uma maneira de adicionar ACKNOWLEDGED à entrada de log para que eu possa filtrá-los por meio de verificação de log? Aqui está um exemplo da entrada de registro atual:

Aug 16 00:00:00 nagios[4711]: CURRENT SERVICE STATE: ;Apache Servers;CRITICAL;HARD;4;CRITICAL - Socket timeout

E o que eu gostaria de realizar é:

Aug 16 00:00:00 nagios[4711]: CURRENT SERVICE STATE: ACKNOWLEDGED; Apache Servers;CRITICAL;HARD;4;CRITICAL - Socket timeout

ou algo similar.

Eu também estarei postando isso nos fóruns do Nagios, então desconsidere qualquer mensagem cruzada.

    
por Ed Dunn 30.08.2017 / 20:20

1 resposta

3

Sua maneira de gerenciar alertas é bem estranha. Quer dizer, o Nagios tem seu próprio mecanismo de notificação que funciona muito bem, você não precisa verificar os logs. Mas se você quiser continuar com sua abordagem, posso ver três soluções:

  • Corrigindo a origem. Este não é realmente o caminho que eu tomaria. Além disso, se você alterar o formato dos registros, você acabará quebrando as páginas de relatórios, já que eles usam os registros como fonte de informações
  • criando um contato falso com um script de notificação que analisa o evento e grava em um arquivo de log com todas as informações que você deseja / precisa
  • o mesmo que acima, mas usando um Event Handler (eu usaria isso)

algumas informações da documentação do Nagios:

por 07.09.2017 / 16:23

Tags