Escolhendo um sistema de monitoramento para um ambiente de dimensionamento dinâmico: Nagios v. Zabbix [closed]

5

Ao operar nas caixas de nuvem e dimensionamento automaticamente, há certos problemas de monitoramento que ocorrem. Às vezes, podemos estar monitorando 10 caixas e, às vezes, 100. As máquinas serão dimensionadas para cima e para baixo com base em uma demanda.

Neste momento, acho que a melhor solução para isso é escolher uma solução de monitoramento que instanciará os alvos por meio de chamadas para uma API. Mas isso é realmente o melhor? Eu gosto da ideia de descoberta dinâmica, mas isso também é um problema na nuvem, já que os destinos não estão todos na mesma sub-rede.

Quais soluções de monitoramento permitem um ambiente de dimensionamento como esse? Atualmente, o Zabbix tem um rascunho da API , mas não consegui financiar uma API semelhante para o Nagios. Existe uma API semelhante para o Nagios?

Alguém tem alguma sugestão alternativa além do Nagios e do Zabbix?

    
por wickett 17.05.2010 / 17:10

7 respostas

3
Farmville , que afirma estar adicionando centenas de servidores por semana, usa Puppet , Nagios e Munin para lidar com seu sistema de monitoramento escalável. Eles provavelmente usam os dados do Puppet para preencher os arquivos de configuração do Nagios ou para configurar o NRPE . Com tantos servidores, uma ferramenta de gerenciamento de configuração, como o Puppet, é praticamente uma exigência.

Alguns exemplos encontrados por meio da pesquisa de "fantoches nagios":

link

link

link

    
por 02.12.2010 / 03:38
3

Use o Zabbix. Sua próxima versão 2.0 tem um monte de novos recursos para coisas como esta. A versão atual 1.8 tem registro automático.

O documento "Novos recursos" fala sobre esse recurso:

4.2.2 Registro automático para agentes ativos

Completamente novo no Zabbix 1.8, é possível permitir o registro automático ativo do agente Zabbix, após o qual o servidor pode começar a monitorá-lo. Isso permite adicionar novos hosts para monitoramento sem qualquer configuração manual do servidor para cada host individual.

O recurso pode ser muito útil para o monitoramento automático de novos nós do Cloud. Assim que você tiver um novo nó no Cloud Zabbix, ele iniciará automaticamente a coleta de dados de desempenho e disponibilidade do host.

    
por 27.07.2011 / 17:28
1

Não há sugestões, mas sua lógica é boa: em ambientes dinâmicos como o que você descreve quando um host aparece, ele precisa se registrar com qualquer coisa que precise saber sobre sua existência (por exemplo, o sistema de monitoramento) para baixo, é necessário cancelar o registro das coisas que precisam saber que está indo embora.

A pergunta que eu gostaria de fazer é que você precisa monitorar seus servidores "workhorse"? Se eles são nós de computação ou similares e você sabe que a configuração deles é estável & "só funcionará" quando for monitorada a própria nuvem (quantas instâncias estão em execução) pode ser tão bom quanto rastrear as máquinas individuais, supondo que seu provedor de nuvem permita o acesso a essas estatísticas facilmente.

    
por 17.05.2010 / 17:26
1

Se você configurar nagios para carregar diretórios de arquivos de configuração usando "cfg_dir", basta adicionar ou remover um arquivo cfg quando um nó for adicionado ou removido e reiniciar nagios. Não há necessidade real de uma API, ela pode ser configurada com alguns pequenos scripts de shell e SSH com arquivos de chaves.

Eu não tenho experiência com o Zabbix, mas posso recomendar o Nagios, já que é muito fácil de configurar, executar e personalizar.

    
por 23.05.2010 / 22:15
1

para o zabbix api, existe uma ferramenta de linha de comando zabcon ( link ). ainda não está totalmente funcional, mas deve suportar algumas operações básicas de host e item - talvez você possa trabalhar com isso.

    
por 25.05.2010 / 08:28
1

Embora eu não tenha experiência com o Zabbix, tenho certeza de que o Nagios não será capaz de fazer isso por você sem uma intervenção do administrador, muito menos fora da caixa. O problema é que quando você cria um arquivo de configuração (para adicionar um host) ou edita / exclui um, você precisa reiniciar o Nagios. Ao reiniciar, levará alguns minutos (dependendo das configurações) para fazer a primeira verificação dos serviços nesses hosts (verificar se o host em si só deve levar alguns segundos). Se essas máquinas forem adicionadas ou removidas várias vezes ao dia, prevejo que esse seja seu primeiro problema.

Você pode usar um sistema para fazer a descoberta para você, o Nagios tem plugins que fazem isso, acredito, mas descobri que arquivos cfg gerados por máquina nunca são tão bons quanto manualmente. Na verdade, a maioria dessas configurações automatizadas é tudo em um ou talvez um punhado de arquivos. O que torna um PITA para gerenciar ...

No entanto, com o Nagios sendo open source e tudo mais, estou confiante de que, se você tiver o conhecimento necessário, poderá codificar e implementar um sistema próprio. Eu suspeito que as máquinas que surgem (ou caem) são VMs, e que elas já têm NSClient ou qualquer agente que você decida usar pré-instalado. Isso significa que se você conseguir que um script seja executado sempre que uma máquina for ativada ou desativada, você poderá criar ou excluir um arquivo de configuração com o nome .cfg ou .cfg e, em seguida, recarregar o Nagios. Obtenha o script para editar o nome do host e o ip do host em questão e pronto! Isto é, claro, se o primeiro ponto que fiz não for importante para você ...

Boa sorte

    
por 25.05.2010 / 09:38
0

Já faz um tempo desde que eu joguei com o Zenoss , mas eu acho que pode ser o que você está procurando para.

    
por 17.05.2010 / 17:24