É Collectd uma boa opção para coletar métricas do sistema [closed]

3

Eu tive alguma experiência com o collectd um ano atrás. Eu lembro de ter ficado impressionado com sua velocidade e flexibilidade, mas nunca foi adotado como a principal fonte de coleta de métricas, tarefas agendadas executando scripts para enviar dados para statsd / graphite / nagios continuaram a ser a escolha certa.

O assunto surgiu novamente depois que algumas das métricas coletadas foram consideradas menos precisas.

E eu queria saber se o collectd ainda é considerado uma boa escolha para tal tarefa, ou se algo melhor apareceu que pode fazer o trabalho.

Os requisitos para a coleta de métricas são:

  • eles são coletados pelo menos uma vez por minuto
  • facilmente implantado via fantoche ou chef
  • profundidade de suporte para coisas como a JVM, processos do sistema, MySQL, postgress, haproxy e outros componentes da plataforma opensource

Eu estaria interessado em ouvir de alguém com experiência nesta área

    
por Brent 14.03.2015 / 23:32

2 respostas

0

O Collectd é uma boa opção para coletar e apresentar estatísticas. Ele pode coletar de várias origens e, se você estiver buscando estatísticas detalhadas e agregações de dados de determinados aplicativos, poderá alimentar a saída statd em collectd. Você pode enviar as coisas para Nagios / Icinga e / ou Graphite.

  • O Collectd pode ser configurado para coletar etapas de 1 segundo por meio do interval directiva.
  • Não posso falar de fantoche ou chef, mas a implantação via Salt funciona sem problemas.
  • Não é possível responder aos seus exemplos específicos, mas o collectd tem muitos, vários plugins (uma rápida olhada mostra MySQL, Postgre e um plug-in Java genérico) e coleta todas as coleções de systat de dados por si mesmo.
por 15.03.2015 / 01:36
0

Eu recomendaria definitivamente o Collectd em alguma solução de script de shell caseiro (na verdade, qualquer coisa é melhor do que scripts de shell propensos a falhas).

É muito leve e não usa muitos recursos, pode ser facilmente estendido com Python ou mesmo por reutilizando seus scripts de shell existentes , mesmo que não tenha módulos para um determinado serviço que você deseja monitor, você pode facilmente fazer um.

Um intervalo de minutos não é um problema, pois o intervalo padrão é ainda menor, definido para 10 segundos .

Eu não posso falar sobre qualquer compatibilidade de ferramentas de gerenciamento de configuração, mas infelizmente isso deve ser bom, especialmente porque muitas distribuições fornecem versões empacotadas que você pode mencionar em seus arquivos Puppet / Chef.

    
por 15.03.2015 / 01:58