Notificações por email sobre o status do RAID de hardware

2

Eu tenho um servidor com o controlador RAID de hardware HP Smart Array. Para monitorar seu status, eu uso o cpqarrayd. /etc/default/cpqarrayd contém DAEMON_OPTS="-t localhost:162" para enviar traps SNMP quando algo acontece. As armadilhas são tratadas pelo snmptrapd, /etc/snmp/snmptrapd.conf contains

disableAuthorization yes
traphandle default mailx -s "SNMP Trap" [email protected]

Os e-mails recebidos desta forma contêm SNMP Traps, mas não são legíveis por humanos, e é impossível dizer de que se trata, ou se foram emitidos pelo cpqarrayd ou não. É possível enviar e-mails legíveis quando o status do RAID muda?

Solução

O seguinte script colocado em cron.hourly:

#!/bin/sh

CCISS_DEVICE=/dev/cciss/c0d1
STATUS_FILE=/var/cciss_vol_status
TMP_FILE=$TMPDIR/status-$$.$RANDOM

mv $STATUS_FILE $TMP_FILE
cciss_vol_status $CCISS_DEVICE >$STATUS_FILE

if ! cmp -s $STATUS_FILE $TMP_FILE ; then
    mailx -s "CCISS status changed" [email protected] <$STATUS_FILE
fi

rm $TMP_FILE
    
por Michael Ivko 25.04.2014 / 12:49

2 respostas

1

Primeiro, veja: Como faço para que meus servidores HP me enviem um email quando uma unidade falha?

Em resumo, os agentes de gerenciamento do HP SNMP instalados como parte do Service Pack para ProLiant ou Pacote de Componentes de Gerenciamento (Debian) irá fornecer-lhe os alertas apropriados para a saúde do sistema. Isso inclui armadilhas para discos, controlador de array, ventilador, temperatura, fontes de alimentação, ILO, NICs, etc.

Isto é totalmente suportado pelo Debian. Você encontrará os downloads no Repositório de entrega de software da HP .

Duas partes para isso ( configuradas automaticamente pelo instalador ):

No seu arquivo snmpd.conf :

# Following entries were added by HP Insight Management Agents at
#      Thu Mar 18 04:14:43 PDT 2010
dlmod cmaX /usr/lib64/libcmaX64.so

Isso registra os agentes de integridade da HP com o SNMP.

E o arquivo /opt/hp/hp-snmp-agents/cma.conf :

############################################################
#
# cma.conf: HP Insight Management Agents configuration file
#
############################################################

########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
#             trapemail /usr/bin/logger
#       will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' [email protected]

E-mails de alerta típicos de RAID serão parecidos com:

Trap-ID=3040

Accelerator Board Battery status change, slot number: 1.
Battery failed. Status: Failed..

ou

Trap-ID=3034

Logical Drive Status Change: Slot 1, Drive: 2.Status is now Rebuilding.

ou

Trap-ID=3034

Logical Drive Status Change: Slot 1, Drive: 1.Status is now OK.

EDITAR:

Parece que você está tendo dificuldades com um ProLiant da série 100, agentes HP Health e Debian. Esta é uma solução suportada, mas dependendo de como você instalou e configurou a solução, você pode ter problemas . Dado isso, você provavelmente pode apenas instalar o utilitário cciss_vol_status e executar uma verificação periódica via cron.

    
por 25.04.2014 / 14:14
0

snmptt (SNMP Trap Translator) é uma ótima ferramenta para isso. Você pode ensinar os OIDs e mensagens típicos e traduzi-los para alguma mensagem sensata. Dê uma olhada e veja se é bom para as suas necessidades.

EDIT: Se você ainda não tem, vá e faça o download de um SNMP MIB para o seu dispositivo e coloque-o no diretório /usr/share/snmp/mibs . Em seguida, reinicie o snmpd e o snmptrapd.

    
por 25.04.2014 / 13:05