Como eu vejo a tag nagios em sua pergunta, você considerou integrando o Ganglia e o Nagios? Se sim, dê uma olhada nisso:
Na pasta do código fonte do Ganglia, existe um script chamado check_ganglia.py
, que pode ser usado como um plugin do Nagios para relatar as métricas do Ganglia.
define command {
command_name check_ganglia
command_line $USER1$/check_ganglia.py -h $HOSTNAME$ -m $ARG1$ -w $ARG2$ -c $ARG3$
}
Um exemplo de definição para monitorar o sistema da CPU:
define service {
use generic-service
hostgroup_name ganglia-servers
service_description cpu_system
check_command check_ganglia!cpu_system!70!80
max_check_attempts 5
check_interval 5
retry_interval 3
check_period 24x7
notification_interval 60
contact_groups admin
}