Soluções gráficas Nagios vs Munin / Cacti / Ganglia

9

Eu tenho uma configuração de servidor nagios para monitorar ~ 30 servidores Windows. Eu quero adicionar alguns gráficos de tendência. Eu li que os plug-ins gráficos nagios são simples e muitas pessoas usam ferramentas independentes de gráficos / tendências.

Quais são as restrições dos nagios plugins gráficos versus produtos independentes, como gânglios / munin / cactos?

Estou interessado em recursos e vantagens específicos que os pacotes independentes oferecem e os plug-ins gráficos nagios não oferecem.

    
por sumek 21.01.2011 / 10:53

6 respostas

7

dado que você já tem uma instalação nagios, considere nagiosgraph ou pnp4nagios.

O nagiosgraph e o pnp4nagios fazem um ótimo trabalho ao traçar dados de desempenho do nagio. O nagiosgraph tem uma abordagem baseada em parâmetros para a configuração, o pnp4nagios tem uma abordagem baseada em modelos.

  • ambos detectam automaticamente novos hosts / serviços sempre que a configuração do nagios é alterada
  • ambos fazem zoom de gráfico
  • ambos fornecem gráficos quando você passa o mouse sobre hosts / serviços específicos
  • fornecem várias maneiras de dividir e dividir seus dados
  • detectam e representam graficamente os níveis críticos e de aviso que você já definiu no nagios
  • os dois podem ser incorporados diretamente no quadro do nagios para uma navegação perfeita e organizada, do status atual ao histórico e de volta

Cortando e cortando os dados são muito importantes, imho. por exemplo, você pode visualizar todos os serviços em um único host, ou visualizar todos os hosts com um serviço específico, ou visualizar coleções arbitrárias de gráficos para hosts e serviços arbitrários.

a instalação não é trivial, mas não é difícil. depende muito de quanto você quer personalizar as coisas. por exemplo, nagiosgraph é 'install.pl' ou 'rpm -i nagiosgraph.rpm' ou 'dpkg -i nagiosgraph.deb'. pnp4nagios é './configure; faço; make install '.

O n2rrd também pode fazer algumas dessas coisas, mas não é tão polido e requer mais trabalho para configurar.

O rrdtool possui peculiaridades de armazenamento de dados, e qualquer sistema terá problemas de amostragem. O rrdtool faz alguma suavização de dados por padrão, mas você pode capturar (e representar graficamente) máximos e / ou mínimos além das médias, se necessário.

toda abordagem baseada em rrdtool sofre de stalação de dados / gráficos, já que o esquema em cada arquivo rrd é estático e a maioria dos sistemas usa o nome do arquivo rrd para identificar os dados. os dados geralmente nunca são perdidos quando um nome de host ou nome de serviço é alterado; os arquivos rrd ainda existem no disco. mas algumas interfaces de usuário fornecem maneiras de ver arquivos rrd 'obsoletos', outros exigem manutenção manual via linha de comando. em muitas instalações, isso é apenas um problema ao configurar inicialmente o sistema, mas em ambientes dinâmicos (por exemplo, monitorar máquinas virtuais cuja duração é de apenas alguns meses) pode se tornar tedioso.

uma nota final. Na verdade, existem duas partes para tendências: coleta de dados e exibição de dados. Se você usar um sistema de gráficos autônomo em vez de estender sua instalação nagios existente, talvez seja necessário instalar componentes adicionais em suas máquinas Windows para coletar os dados.

    
por 05.02.2011 / 03:11
13

Concordo com o lynxman. NAGIOS é para dados qualitativos imediatos (X OK ou não?); munin é para dados quantitativos históricos (quão cheio é o X agora e quão completo tem sido este ano?). Todas as minhas instalações NAGIOS, algumas das quais monitoram várias centenas de serviços, estão ligadas a sistemas munin para fazer o monitoramento quantitativo.

Note também que munin possui ganchos específicos para alimentar dados no NAGIOS. Ele entende o conceito de limiares de ADVERTÊNCIA e CRÍTICO, e onde a notificação (e uma visão do NAGIOS "big board") é requerida é muito fácil ter uma única variável munin informando o estado de um único serviço NAGIOS.

O fluxo de trabalho usual é que ninguém olha para os gráficos munin até que o NAGIOS alerta que um limite foi violado, mas então os gráficos munin se tornam inestimáveis para descobrir se algo está aumentando lentamente com o tempo, ou se é um resultado aumento do azul, ou temos um ciclo semanal de subida e descida que aumenta lentamente em amplitude, ou o que.

Como Lynxman diz, a maneira UNIX é "uma tarefa, uma ferramenta". Fazer uma cadeia de ferramentas de munin e NAGIOS funciona muito bem para eu fornecer monitoramento quantitativo e qualitativo, bem como notificações. Ele também tem a vantagem de manter as interfaces limpas: quando você olha para o NAGIOS, você vê uma visão simples de como as coisas estão funcionando agora , sem dados históricos bagunçando a visão; Quando você olha para Munin, você vê informações históricas pertinentes à questão, prontas para sua análise, sem erros "host is down" ou "sshd não fala comigo", bagunçando a visão.

    
por 21.01.2011 / 12:18
3

Nagios plugins gráficos, como você diz, são muito restritos, eles oferecem uma interface rrdtool muito básica e o design da UI é um pouco intuitivo, é basicamente um hack para nagios, tentei usá-lo apenas por diversão, mas ele quebrou várias vezes sem aviso.

Buscar um produto autônomo (especialmente munin ou gânglio) oferece uma grande variedade de serviços que os nagios não podem realizar, como o mantra unix é melhor ser bom em apenas uma coisa do que tentar ser bom em muitos, nagios é incrível para monitoramento e munin / gânglios / cactos são surpreendentes em gráficos.

    
por 21.01.2011 / 11:55
2

No Stack Overflow, usamos n2rrd , que é um plugin do Nagios para representar graficamente os dados de desempenho. Até certo ponto, eu concordaria com o lynxman que ele tem uma grande sensação de pessimismo.

No entanto:

  • Com n2rrd você pode fazer com que o Cacti faça o gráfico baseado nos dados em vez do rrd2graph.cgi que vem com o n2rrd
  • n2rrd com o rrd2graph.cgi suporta zoom
  • No que diz respeito a gráficos agregados complicados - você basicamente manipula os gráficos rrd à mão e pode fazer o que quiser com eles.

Os gráficos rrd são armazenados de acordo com os nomes dos servidores, por isso, se você alterar o nome de algo que solta os dados ... Você pode simplesmente renomear os arquivos, eles são links simbólicos e você não perderá os dados .

Eu tenho alguns exemplos desses gráficos nas minhas recentes Algumas dicas para melhorar a RRD Gráficos Postagem do Blog de falhas do servidor. Além disso, a página n2rrd inclui tanto a demonstração do cacti como o rrd2graph.

Acho que o resultado final é que a rota do Nagios pode estar faltando em um recurso ou dois, mas é bem completa se você não se importa em sujar as mãos com os detalhes de escrever modelos rrd você mesmo*. É, provavelmente, vai demorar mais do seu tempo, mas vai incentivar a desenvolver mais conhecimentos em rrd.

    
por 21.01.2011 / 14:25
0

Eu exijo dados precisos e a exibição de dados do rrd não é precisa - é normalizada! Para a maioria dos usuários, isso é bom porque eles não estão usando dados muito precisos para começar. Eles estão usando dados cujas taxas de amostragem são geralmente de um minuto ou mais e isso não lhe dará uma descrição precisa do que está acontecendo. Isso também significa que, se você tiver um pico em seus dados em algum lugar, talvez nunca o veja.

Considere isso - digamos que sua rede Gb está funcionando a cerca de 10MB / s e, de repente, há um pico de 100MB / seg por alguns minutos. Observe também se foi apenas um pico de 30 segundos que você pode nem vê-lo em taxas de amostragem de alguns minutos. Se você observar os dados do dia, esse "pico" pode aparecer apenas como 15 MB / s, embora o valor real também dependa de vários outros fatores. Há também uma probabilidade muito provável que você assuma que sua rede está feliz quando não está!

O que é ainda mais frustrante para mim são os dados normalizados para a largura física do gráfico e alcance do eixo x. O que isso significa é que o pico que mencionei que você não viu? Se você aumentar o zoom magicamente aparece! Vou me ater ao gnuplot - os gráficos podem não ser tão bonitos, mas são sólidos e o gnuplot nunca modifica os dados antes de exibi-los.

-mark

    
por 04.02.2011 / 13:33
0

Acho que usar o pnp4nagios funciona muito bem para gráficos. Suporta zoom também. Não é o mais fácil de implementar, mas nada com os nagios é.

    
por 04.02.2011 / 15:35