Não é possível adicionar o novo nó munin ao mestre munin existente

3

Eu estou tentando adicionar um nó a um mestre munin existente (que eu não configurei, mas que parece estar funcionando bem, pois mostra gráficos para 8 nós existentes) e estou tendo alguns problemas. Aqui estão os passos que segui:

Mestre

Adicionado o nó ao /etc/munin/munin.conf

[server.example.org]
   address private.server.example.org

O diretório html do master é (corresponde à configuração do apache):

htmldir /opt/munin

Esse diretório contém os seguintes arquivos e pastas:

ls -lh /opt/munin/
drwxr-xr-x 20 munin munin 4.0K 2011-11-07 16:15 example.org <= FOLDER NAMED AFTER OUR DOMAIN
-rw-r--r--  1 munin munin 2.5K 2010-08-03 14:11 definitions.html
-rw-r--r--  1 munin munin 3.0K 2010-08-03 14:11 favicon.ico
-rw-r--r--  1 munin munin  15K 2011-11-07 16:21 index.html  <= MAIN MUNIN PAGE
-rw-r--r--  1 munin munin 1.8K 2010-08-03 14:11 logo-h.png
-rw-r--r--  1 munin munin  473 2010-08-03 14:11 logo.png
-rw-r--r--  1 munin munin 5.6K 2010-11-03 14:07 style.css

O rodapé do index.html indica que este arquivo é gerado dinamicamente pelo munin, então eu sei que não preciso tocar neste arquivo.

This page was generated by <a href='http://munin-monitoring.org/'>Munin</a> version 1.4.4 at 2011-11-07 16:21:30+0000 (UTC)

O diretório do domínio contém pastas para todos os nós. Acabei criando um para o novo nó esperando que ajudasse, mas não fazia diferença

mkdir /opt/munin/example.org/server.example.org
chown munin:munin -R /opt/munin/example.org/server.example.org

Eu matei munin-cron e reiniciei, mas também não faz diferença.

$ sudo su munin munin-cron start
$ sudo ps aux | grep munin-cron
munin    26566  0.0  0.2   4092   584 ?        Ss   16:35   0:00 /bin/sh -c if [ -x /usr/bin/munin-cron ]; then /usr/bin/munin-cron; fi
munin    26567  0.0  0.2   4092   576 ?        S    16:35   0:00 /bin/sh /usr/bin/munin-cron

Nó de Munin

Pacote munin-node instalado

apt-get install munin-node

Modificado o arquivo /etc/munin/munin-node.conf para permitir acces do mestre munin

host *
allow ^A\.B\.C\.D$  # master IP address
port 4949

Nó munin reiniciado

service munin-node start

Se eu executar um tcpdump no novo nó, eu posso ver alguns dados sendo trocados com o mestre, então acredito que o problema é com a configuração do mestre.

Alguma ideia do que estou escrevendo ou como posso resolver isso ainda mais?

Resolução de problemas adicionais

Como recomendado, verifiquei os registros

$ grep server.example.org /var/log/munin/munin-update.log

2011/11/08 08:40:03 [WARNING] Config node server.example.org listed no services for server.example.org.  Please see http://munin-monitoring.org/wiki/FAQ_no_graphs for further information.
2011/11/08 09:10:02 [INFO] Reaping Munin::Master::UpdateWorker<example.org;server.example.org>.  Exit value/signal: 0/0

O aviso me trouxe para esta página link . Eu segui os passos a passos dados pelos aconselhados. Embora os links simbólicos parecessem ter sido criados corretamente, executei o comando munin-node-configure --shell | sh -x , que acredita ter resolvido o problema. A página acima também recomendou alterar o conjunto host_name que eu fiz (embora eu não acredite que tenha ajudado, já que os outros nós de trabalho não têm configurado).

A solução de problemas de telnet foi bem-sucedida quando cheguei a ela

$ telnet private.server.example.org 4949
Trying A.B.C.D...
Connected to private.server.example.org.
Escape character is '^]'.
# munin node at server.example.org

> nodes
server.example.org
.

> list server.example.org
cpu df df_inode entropy forks fw_conntrack fw_forwarded_local fw_packets if_err_eth0 if_err_eth1 if_eth0 if_eth1 interrupts iostat iostat_ios ip_A.B.C.D irqstats load memory open_files open_inodes postfix_mailqueue postfix_mailvolume proc_pri processes swap threads uptime users vmstat

> fetch df
_dev_sda1.value 23.1295909196156
_dev.value 1.2890625
_dev_shm.value 0
_var_run.value 0.00782368542525642
_var_lock.value 0
_lib_init_rw.value 0
    
por Max 07.11.2011 / 17:44

2 respostas

3

Não consigo ver nada de errado com a sua configuração. Vou sugerir duas coisas;

  • Leia os registros no munin-master. /var/log/munin/munin-update.log é o lugar para começar. Se você tiver entradas confirmando que uma atualização foi bem-sucedida e você obteve os arquivos rrd em /var/lib/munin/ - continue com munin-graph.log e munin-html.log

  • Verifique se o mestre é capaz de se conectar ao endereço do nó munin. Por favor, teste com netcat ou similar: nc private.server.example.org 4949 . A saída esperada deve ser: # munin node at hostname . Possíveis erros são pacotes sendo descartados por um firewall (enquanto o nc irá travar em connect() , visível se você usar strace), ou não conseguir resolver o nome (enquanto o netcat gera nc: getaddrinfo: Name or service not known ).

Se você não encontrar nada depois de tentar o acima, por favor, cole um munin.conf completo do mestre, (anonimize os endereços IP numéricos com números e nomes de host com algum texto falso, se for necessário).

Erro não muito incomum; O cron-job pode ter sido invocado pelo root em algum momento, onde alguns arquivos têm propriedade de root e não podem ser atualizados pelo munin-user, que geralmente precisa de acesso de gravação a todos os arquivos em / var / lib / munin e o diretório html.

    
por 07.11.2011 / 18:07
1

Ei, eu tive o mesmo problema.

Verifique seu arquivo / etc / hosts no host e verifique que o primeiro nome de host é o mesmo que você especificou no seu arquivo conf munin no servidor.

Isso destruiu nossa configuração até descobrirmos.

nosso / etc / host foi configurado para: 1.2.3.4 hostname hostname.domain

Munin conf foi definido como hostname.domain. O servidor achou que era nomeado hostname e não hostname.domain ..

    
por 04.01.2017 / 10:55