Monitorando o servidor de produção [fechado]

18

Temos 3 servidores dedicados, divididos em vários VPS usando o openVZ. Estamos usando munin para monitorar o VPS com os sites de produção e monitore um dos VPS para garantir que ele reinicie o serviço quando falhar.

Coisa é que precisamos de uma maneira muito melhor de monitorar todos os nossos servidores, já que temos até 14 VPSs, gostaríamos de ter um hub central onde pudéssemos ver não apenas os dados coletados pelo munin, mas também alguns mais estatísticas extras sobre as redes e performances de nossos serviços.

Alguns dos nossos requisitos:
- notificação por SMS sobre falha (capacidade de configurar determinada verificação personalizada)
- Log analyzer para apache error_log e alguns outros.
- Deve ser central (significando um servidor e vários nós coletando os dados). - Não precisa ser fácil de instalar, mas fácil de manter.
- Precisa ser livre

Eu tenho sido apontado para nagios e splunk, o que você acha? Obrigado,

    
por Adam Benayoun 18.09.2009 / 18:08

4 respostas

17

Eu tenho uma configuração semelhante, exceto com o Xen no lugar. Eu fiquei muito feliz com uma combinação de:

  • Nagios para alertas (usando PNP para alguns gráficos simples e Nagviz para um painel de estado de serviço)
  • Ganglia para gráficos históricos de sistemas
  • OSSEC como um HIDS e igualmente importante como coletor para o registro centralizado
    • sidenote: Existe um plugin do Splunk para o OSSEC que integra estas duas ferramentas muito bem, estou aguardando que elas sejam portadas para o Splunk v4.
  • Splunk Por fim, quando alguns plug-ins do Splunk são migrados, planejamos usar o Splunk com alguma pré-filtragem de logs (para não passar do limite de edições gratuitas)

Espero que compartilhar nossa configuração de monitoramento o ajude: -)

Aqui estão alguns links úteis:

link

link

link

update:

Esqueci de mencionar que também usamos o layout de configuração do Matt Simmons Nagios, encontrado aqui link

Esse layout tornou nossa Configuração do Nagios saudável e muito mais fácil de manter (Obrigado Matt!)

    
por 18.09.2009 / 18:43
5

Eu tive um grande sucesso com o Zabbix , ele satisfaz todos os seus pontos em um pacote.

A parte mais difícil será obter o monitoramento do log do apache, mas o Zabbix é extensível para que você possa usar o LogWatch ou algum outro script perl para obter dados para você.

    
por 18.09.2009 / 20:14
2

Eu gosto do OpManager, e é liberado para um certo número de nós. Faz todos os itens acima e é muito fácil de instalar e manter.

    
por 18.09.2009 / 18:13
1

O Nagios deve ser uma boa escolha. Primeiro de tudo - é modular e satisfaz praticamente todas as suas expectativas. Além disso, recebeu alguns prêmios agradáveis .

EDIT: Não se esqueça de verificar esta resposta .

    
por 18.09.2009 / 18:23