Eu delineei minha jornada para o monitoramento de nagios de sub-segundo-por-hospedeiro através da mina de sal e check_mk aqui:
link
O artigo aborda semanas de ajustes para que tudo funcione. Vou resumir a solução:
Crie um módulo check_mk personalizado para todos os minions:
#!/usr/bin/env python
''' Support for running check_mk_agent over salt '''
import os
import salt.utils
from salt.exceptions import SaltException
def __virtual__():
''' Only load the module if check_mk_agent is installed '''
if os.path.exists('/usr/bin/check_mk_agent'):
return 'check_mk'
return False
def agent():
''' Return the output of check_mk_agent '''
return __salt__['cmd.run']('/usr/bin/check_mk_agent')
Defina o intervalo de minas de minions para um minuto:
salt '*' file.append /etc/salt/minion.d/mine.conf "mine_interval: 1"
Configure o servidor de monitoramento para extrair toda a saída check_mk_agent do minion em um único arquivo json e, em seguida, configure check_mk para consultar esse arquivo em vez de qualquer consulta de rede. Tudo realizado com o seguinte script no minion de monitoramento:
#!/usr/bin/env python
import sys
import json
import fcntl
DATAFILE="/dev/shm/cmk.json"
NAG_UID = 105
NAG_GID = 107
def do_update():
import os
import salt.client
caller = salt.client.Caller()
data = caller.function('mine.get', '*', 'check_mk.agent')
lockfile = open(DATAFILE+".lock", "w")
fcntl.flock(lockfile, fcntl.LOCK_EX)
datafile = open(DATAFILE, "w")
datafile.write(json.dumps(data))
for f in (DATAFILE, DATAFILE+".lock"):
os.chmod(f, 0644)
os.chown(f, NAG_UID, NAG_GID)
def get_agent(minion):
lockfile = open(DATAFILE+".lock", "w")
fcntl.flock(lockfile, fcntl.LOCK_SH)
data = json.load(file(DATAFILE))
return data[minion]
if __name__ == '__main__':
if len(sys.argv) != 2:
print "Usage: mine_agent.py --update | <minion id>"
elif sys.argv[1] in ['--update', '-u']:
do_update()
else:
minion = sys.argv[1]
print get_agent(minion)
Atualize a cada minuto:
$ cat /etc/cron.d/retrieve_mined_minion_data
*/1 * * * * root /etc/check_mk/mine_agent.py --update
Finalmente: Altere a fonte de dados para todos os alvos do nagios em /etc/check_mk/main.mk:
datasource_programs = [
( '/etc/check_mk/mine_agent.py <HOST>', ['mine'], ALL_HOSTS ),
]