Problemas no RAID não sendo relatados pelo Nagios / Icinga - usando check_raid

1

Estou executando o script check_raid em várias máquinas e notei hoje que uma de minhas máquinas estava em estado degradado, mas não estava sendo alertada. O script está retornando "CRITICAL", mas Icinga vê isso como ok.

Veja o que estou vendo na minha máquina Icinga (substituí o disco):

SNMP OK - "CRITICAL: tw_cli:[c3(9650SE-4LPML): u0(RAID-10): REBUILDING 65%, Cache:Ri, Drives(4): p2=DEGRADED p0,p1,p3=OK]" 

A configuração desta máquina é muito simples:

define service{
use generic-service
host_name test
service_description RAID Status
check_command check_raid
}

Aqui está a definição do comando:

define command{
command_name    check_raid
command_line    /usr/lib/nagios/plugins/check_snmp -H $HOSTADDRESS$ -o ucdavis.80.3.1.1.13.47.117.115.114.47.98.105.110.47.112.101.114.108 -C public -r "OK"

E na máquina que está sendo verificada eu tenho o seguinte no snmpd.conf:

extend .1.3.6.1.4.1.2021.80 /usr/bin/perl /usr/local/bin/check_raid.pl

Estou usando a versão mais recente do script. Alguém tem alguma ideia sobre o que estou fazendo de errado? O -r "OK" está sempre retornando um ok?

    
por Bob 03.11.2016 / 16:59

1 resposta

1

O script nagios corresponde a 3 das suas 4 condições de retorno, e é por isso que ele retorna OK.

De documentação do check_snmp :

-r, --ereg=REGEX
   Return OK state (for that OID) if extended regular expression REGEX matches

Seu script retorna o seguinte (editado por mim para breve):

"CRITICAL: [...] p2=DEGRADED p0,p1,p3=OK]" 

O check_snmp vê p0, p1, p3 OK e devolve OK , ignorando p2

Eu tentaria sem o -r "OK" e confirme se você obtém os resultados esperados. Se o resultado de retorno incorreto persistir, eu experimentaria com --invert-search :

 --invert-search
    Invert search result (CRITICAL if found)
    
por 03.11.2016 / 18:44