alertas por e-mail quando ocorrem erros graves no sistema

4

Eu estava digitando o syslog em um servidor por erros e notei essas linhas que não tinham nada a ver com o que eu estava procurando, mas estavam alertando o suficiente:

kernel: [8456851.218586] ata2.00: irq_stat 0x08000000, interface fatal error
kernel: [8456851.220076]          res 50/00:00:80:45:c1/00:00:08:00:00/e0 Emask 0x10 (ATA bus error)

Como posso ter certeza de que meus servidores me alertam com um e-mail quando ocorrem erros semelhantes? Eu preciso pelo menos pegar todos os erros de unidade (quando se trata de servidor H / W eu tenho que lidar com interrupções de fornecimento de energia e falhas de HDD mais do que qualquer outra coisa). No entanto, qualquer coisa que tenha uma grande chance de indicar uma falha futura é digna de um e-mail, contanto que eu não receba muitos falsos negativos que eu pare de procurar cuidadosamente nesses e-mails.

    
por ndemou 06.10.2014 / 23:25

2 respostas

3

Eu uso logcheck para verificar meus arquivos de log. Ele escaneia novas entradas uma vez por hora e envia um e-mail para todas as linhas desconhecidas, bem como as linhas conhecidas que são incluídas no relatório.

Existem também ferramentas que irão assistir seus arquivos de log e enviá-lo por e-mail quando determinado conteúdo.

    
por 07.10.2014 / 00:25
1

Eu uso o módulo ommail em rsyslog . A configuração é simples, você pode usar vários servidores smtp para enviar seus e-mails de alerta (como um failover):

$template mailSubject,"EMERGENCY:"
$template mailBody," %$NOW% %timereported:8:15%  %programname%: %msg%\n"

$ActionMailSMTPServer                   mail1.example.com
$ActionMailFrom                         [email protected]
$ActionMailTo                           [email protected]
$ActionMailSubject                      mailSubject
$ActionExecOnlyOnceEveryInterval        60
*.emerg                                 :ommail:;mailBody

# begin backup action, carried out if primary fails
$ActionExecOnlyWhenPreviousIsSuspended  on
$ActionMailSMTPServer                   mail2.example.com
$ActionMailFrom                         [email protected]
$ActionMailTo                           [email protected]
$ActionExecOnlyOnceEveryInterval        60
&  
    
por 07.10.2014 / 03:28