serviço Nagios em execução, erro no site: não foi possível ler as informações de status do host e do serviço

3

Nagios foi atualizado de 3.5.1 para 4.0.8

Eu queria perguntar isso no fórum de suporte do nagios, mas uma hora depois, eu não recebi um email de confirmação para configurar minha conta ...

nagios parece rodar OK como um serviço, mas os CGIs da web não estão funcionando, e não há erros em error.log para apache, nem nagios.log. Eu verifiquei a permissão e observei alguns códigos C com esse erro incorporado:

Opa! Erro: não foi possível ler as informações de status do host e do serviço!

O mesmo erro acima aparece para quase todos os menus no lado esquerdo da página principal para nagios.

nagios.log se parece com isso ao iniciar e depois parar, a partir do init:

[1431102009] Nagios 4.0.8 starting... (PID=27779)
[1431102009] Local time is Fri May 08 13:20:09 ADT 2015
[1431102009] LOG VERSION: 2.0
[1431102009] qh: Socket '/usr/local/nagios/var/rw/query.sh' successfully initialized
[1431102009] qh: core query handler registered
[1431102009] nerd: Channel hostchecks registered successfully
[1431102009] nerd: Channel servicechecks registered successfully
[1431102009] nerd: Channel opathchecks registered successfully
[1431102009] nerd: Fully initialized and ready to rock!
[1431102009] wproc: Successfully registered manager as @wproc with query handler
[1431102009] wproc: Registry request: name=Core Worker 27785;pid=27785
[1431102009] wproc: Registry request: name=Core Worker 27786;pid=27786
[1431102009] wproc: Registry request: name=Core Worker 27782;pid=27782
[1431102009] wproc: Registry request: name=Core Worker 27781;pid=27781
[1431102009] wproc: Registry request: name=Core Worker 27783;pid=27783
[1431102009] wproc: Registry request: name=Core Worker 27784;pid=27784
[1431102009] Successfully launched command file worker with pid 27787
[1431102022] Caught SIGTERM, shutting down...
[1431102022] Successfully shutdown... (PID=27779)
[1431102022] Event broker module 'NERD' deinitialized successfully.

A execução com -v está limpa:

# /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

Nagios Core 4.0.8
Copyright (c) 2009-present Nagios Core Development Team and Community Contributors
Copyright (c) 1999-2009 Ethan Galstad
Last Modified: 08-12-2014
License: GPL

Website: http://www.nagios.org
Reading configuration data...
   Read main config file okay...
   Read object config files okay...

Running pre-flight check on configuration data...

Checking objects...
        Checked 816 services.
        Checked 826 hosts.
        Checked 11 host groups.
        Checked 0 service groups.
        Checked 18 contacts.
        Checked 13 contact groups.
        Checked 61 commands.
        Checked 6 time periods.
        Checked 0 host escalations.
        Checked 0 service escalations.
Checking for circular paths...
        Checked 826 hosts
        Checked 0 service dependencies
        Checked 0 host dependencies
        Checked 6 timeperiods
Checking global event handlers...
Checking obsessive compulsive processor commands...
Checking misc settings...

Total Warnings: 0
Total Errors:   0

Things look okay - No serious problems were detected during the pre-flight check

Além disso, o check_nagios diz que estamos funcionando OK:

# /usr/local/nagios/libexec/check_nagios /var/log/nagios.log 5 '/usr/local/nagios/bin/nagios'
NAGIOS OK: 8 processes, status log updated 11 seconds ago

Uma possibilidade é o erro significa que ele não pode acessar o arquivo nagios.cfg. Eu verifiquei que o caminho para isso é r-x para 'outro' (para cobrir o usuário do apache) em todos os diretórios no caminho. Em qualquer caso, se houver um problema de permissão, isso deve causar um erro no apache. Eu tenho trabalhado nisso por algumas horas e não consigo encontrar o ponto de falha, ou o que mudou.

A página principal também mostra "Não é possível obter o status do processo" sob o logotipo do Nagios Core. Isto é da execução de statusjson.cgi em main.php - não tenho certeza do que está vendo, mas a página está em branco quando eu executo a consulta CGI (cgi-bin / statusjson.cgi? Query = programstatus) do main.php manualmente. Eu pesquisei isso, procurei no nagios fóruns, mas todo mundo parece ter algum erro de log (s) para dar mais pistas.

Eu tenho uma anomalia ...

Eu encontrei outro nagios.log que está sendo tocado com apenas algumas linhas cada vez que o serviço é iniciado:

# cat /usr/local/nagios/var/nagios.log
[1431088940] Error: Cannot open main configuration file '/' for reading!
[1431088940] Error: Failed to process config file '/'. Aborting

Talvez algo maluco com os arquivos init ou cfg, mas não consigo encontrá-lo. Como outro teste, posso su para nagios e executar o daemon manualmente.

su - nagios
[nagios@atlas ~]$ /usr/local/nagios/bin/nagios /usr/local/nagios/etc/nagios.cfg

Nagios Core 4.0.8
Copyright (c) 2009-present Nagios Core Development Team and Community Contributors
Copyright (c) 1999-2009 Ethan Galstad
Last Modified: 08-12-2014
License: GPL

Website: http://www.nagios.org
Nagios 4.0.8 starting... (PID=23234)
Local time is Fri May 08 13:45:12 ADT 2015
nerd: Channel hostchecks registered successfully
nerd: Channel servicechecks registered successfully
nerd: Channel opathchecks registered successfully
nerd: Fully initialized and ready to rock!
wproc: Successfully registered manager as @wproc with query handler
wproc: Registry request: name=Core Worker 23235;pid=23235
wproc: Registry request: name=Core Worker 23236;pid=23236
wproc: Registry request: name=Core Worker 23237;pid=23237
wproc: Registry request: name=Core Worker 23238;pid=23238
wproc: Registry request: name=Core Worker 23239;pid=23239
wproc: Registry request: name=Core Worker 23240;pid=23240
Successfully launched command file worker with pid 23241

Eu esperava que isso evitasse qualquer coisa estranha no script de inicialização. Ele não toca no /usr/local/nagios/var/nagios.log (esperado), mas não altera o erro do site cgis. Outra pista é que quando o nagios é iniciado manualmente assim, não vejo nenhum registro na tela de hosts e itens de status. Se eu iniciar o init, existem alguns avisos sobre o desempenho de alguns hosts, flapping e a tagarelice usual dos logs do nagios, mas ele não está dizendo mais do que o acima quando iniciado a partir da linha de comando como usuário nagios.

    
por labradort 08.05.2015 / 19:09

1 resposta

3

Essa pergunta acabou indo para o fórum de suporte do nagios core e foi resolvida lá.

link

Neste caso em particular, faltavam as entradas de configuração para

state_retention arquivo_de_estado

mas existem muitos tipos diferentes de erros que também podem levar a o erro da interface da web que começa com "Whoops!".

    
por 12.05.2015 / 15:47

Tags