Primeiro, veja: Como faço para que meus servidores HP me enviem um email quando uma unidade falha?
Em resumo, os agentes de gerenciamento do HP SNMP instalados como parte do Service Pack para ProLiant ou Pacote de Componentes de Gerenciamento (Debian) irá fornecer-lhe os alertas apropriados para a saúde do sistema. Isso inclui armadilhas para discos, controlador de array, ventilador, temperatura, fontes de alimentação, ILO, NICs, etc.
Isto é totalmente suportado pelo Debian. Você encontrará os downloads no Repositório de entrega de software da HP .
Duas partes para isso ( configuradas automaticamente pelo instalador ):
No seu arquivo snmpd.conf
:
# Following entries were added by HP Insight Management Agents at
# Thu Mar 18 04:14:43 PDT 2010
dlmod cmaX /usr/lib64/libcmaX64.so
Isso registra os agentes de integridade da HP com o SNMP.
E o arquivo /opt/hp/hp-snmp-agents/cma.conf
:
############################################################
#
# cma.conf: HP Insight Management Agents configuration file
#
############################################################
########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
# trapemail /usr/bin/logger
# will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm' [email protected]
E-mails de alerta típicos de RAID serão parecidos com:
Trap-ID=3040
Accelerator Board Battery status change, slot number: 1.
Battery failed. Status: Failed..
ou
Trap-ID=3034
Logical Drive Status Change: Slot 1, Drive: 2.Status is now Rebuilding.
ou
Trap-ID=3034
Logical Drive Status Change: Slot 1, Drive: 1.Status is now OK.
EDITAR:
Parece que você está tendo dificuldades com um ProLiant da série 100, agentes HP Health e Debian. Esta é uma solução suportada, mas dependendo de como você instalou e configurou a solução, você pode ter problemas . Dado isso, você provavelmente pode apenas instalar o utilitário cciss_vol_status e executar uma verificação periódica via cron.