Monitorando o HP Smartarray (cciss) com nagios

3

Estou tentando monitorar um controlador HP Smart Array usando nagios. Eu tenho 4 discos em 2 matrizes RAID1, então 2 discos por RAID1.

Eu instalei o nrpe-server e o nrpe-plugins e estou usando o todo-poderoso check_raid plugin, mas parece que só vejo meu primeiro array e não o segundo:

# /usr/lib/nagios/plugins/check_raid
OK: cciss:[/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 0 status: OK, /dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 1 status: OK]

cciss_vol_status informa corretamente para as duas matrizes:

# cciss_vol_status /dev/cciss/c0d0
/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 0 status: OK. 
/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 1 status: OK. 
# cciss_vol_status /dev/cciss/c0d1
/dev/cciss/c0d1: (Smart Array E200i) RAID 1 Volume 0 status: OK. 
/dev/cciss/c0d1: (Smart Array E200i) RAID 1 Volume 1 status: OK. 

Como obtenho check_raid para informar sobre as duas matrizes?

O servidor é um HP Proliant DL360 G5 com um controlador Smart Array E200i. Está atualmente executando o debian wheezy.

    
por GnP 12.01.2015 / 18:07

1 resposta

2

Minha recomendação seria usar os Agentes de Gerenciamento e Saúde HP para o servidor. Aqueles podem enviar e-mail, despejar para o syslog e enviar traps SNMP.

Se você absolutamente deve ter isso informado no Nagios, parece que há muitas opções . Mas um componente do conjunto de ferramentas da HP é o utilitário hpssacli ou hpacucli , cuja saída pode ser analisada:

# hpssacli ctrl all show config

Smart Array P420i in Slot 0 (Embedded)    (sn: 001438025AC2EA0)

   Internal Drive Cage at Port 1I, Box 2, OK

   Internal Drive Cage at Port 2I, Box 0, OK
   array A (SAS, Unused Space: 340650  MB)

      logicaldrive 1 (72.0 GB, RAID 1, OK)
      logicaldrive 2 (600.0 GB, RAID 1, OK)

      physicaldrive 1I:2:1 (port 1I:box 2:bay 1, SAS, 900.1 GB, OK)
      physicaldrive 1I:2:2 (port 1I:box 2:bay 2, SAS, 900.1 GB, OK)

   SEP (Vendor ID PMCSIERA, Model SRCv8x6G) 380  (WWID: 5001438025AC2EAF)

ou

# hpssacli ctrl slot=0 ld 1 show status

   logicaldrive 1 (72.0 GB, 1): OK

# hpssacli ctrl slot=0 ld 2 show status

   logicaldrive 2 (600.0 GB, 1): OK

ou talvez:

# hpssacli ctrl all show config | grep logicaldrive
      logicaldrive 1 (72.0 GB, RAID 1, OK)
      logicaldrive 2 (600.0 GB, RAID 1, OK)
    
por 12.01.2015 / 18:39