Eu acredito que o que você está procurando é um RRDtool para coletar dados para você. Eu uso o check_mk que é uma coleção de extensões para o Nagios, mas há muitas outras opções.
Eu tenho nagios funcionando com o nrpe, mas sou relativamente novo em configurá-lo sozinho.
Existe alguma maneira de obter os números brutos para as verificações, em vez de apenas ok / não ok?
Por exemplo, se eu quiser monitorar o uso de memória de um host em um processo que é executado por algumas horas e ver como ele flutua, os nagios podem fazer isso, ou só me dirá se ele ultrapassa algum limite?
Eu acredito que o que você está procurando é um RRDtool para coletar dados para você. Eu uso o check_mk que é uma coleção de extensões para o Nagios, mas há muitas outras opções.
Geralmente, o nagios avisa você de ok / não está bem. Eu acho que é seguro dizer que a maioria das pessoas usa nagios para que eles saibam se algo estranho está acontecendo em seu ambiente. Ele exibe os números do estado atual, mas isso não parece com o que você está pedindo.
Eu obtive valores de nagios.log antes. Não é bonito, mas é factível, e se este for um tiro único, pode ser a sua melhor aposta. (Exemplo: uma vez me pediram para retirar a história da Exchange comendo todo o seu armazenamento durante um período de tempo.)
Se você está procurando por nagios para checar as flutuações o tempo todo, você pode escrever algum tipo de script customizado para o npre rodar que define ok / not okay como "flutuando demais".
Espero que ajude.
Existem vários add-ons para nagios em RRD (um tipo especial de banco de dados para coletar este tipo de dados de tempo).
No entanto, o nagios é uma má escolha para este tipo de monitoramento de desempenho. Ele realmente funciona melhor como um sistema de alerta e a maioria dos sites usa algo como gânglios ou cactus para rastreamento contínuo de desempenho.
Nagios é o alarme de fumaça, gânglios é o termômetro.
Existe um terceiro campo em cada verificação, no qual você pode colocar qualquer tipo de dado que desejar, mas isso requer a busca do arquivo nagios.log.
O Nagios é melhor para monitorar serviços para garantir que você seja notificado se o serviço / caixa estiver inativo. Eu sugeriria munin para gráficos de recursos do sistema, munin também tem o recurso de alertar, caso um valor de recurso ultrapasse um limite. Estou usando munin (como uma ferramenta secundária de monitoramento) com o Amazon SNS para receber alertas.
Nagios é basicamente um sistema de alerta como os outros disseram, ou seja, não há nenhum sistema de relatórios históricos embutido.
No entanto, existem muitos addons que farão o trabalho por você. Eu acredito que NagiosGraph é o mais comum, o que é simples o suficiente na instalação e no uso.
Você pode ter visualizações diárias, semanais, mensais e anuais de sua métrica e também criar seus próprios gráficos para seus plug-ins manipulando o mapeamento de métricas (o arquivo de mapa do nagiosgraph).
Fora da caixa, por assim dizer, o Nagios não faz nada com os dados reais que são retornados; Você usa um complemento que se conecta ao Nagios para processar os dados. Um dos complementos mais populares para representar graficamente este perfdata é o pnp4nagios . Ele se integra bem com a interface do usuário da web, é fácil de configurar e é empacotado em várias distribuições do Linux também.
Para outras opções, consulte a categoria de gráfico / trending add-on no Nagios Exchange .