“O que acontece?” monitor de desempenho do servidor

2

Depois de revisar alguns tópicos sobre software de monitoramento de servidores, acabo com uma pergunta simples:

Qual das ferramentas de monitoramento de servidor devo usar para detecção automática de situações "anormais" com recomendações sobre como corrigi-las?

Eu procuro um software que verifique o desempenho do sistema após a instalação e calcule alguns valores médios de carga (memória, CPU, etc). E quando algo acontece (a carga da CPU é aumentada para 20%), então ele tenta detectar uma razão para isso. Se for o apache, deve verificar os logs de acesso. Se o mysql, ele deve verificar os logs do mysql e me dizer o que acontece. Isso ocorre porque algum usuário decodifica muitas imagens, eu gostaria de saber qual comando é executado, quando e o nome do usuário. O mesmo para uso de disco, memória, número de processos, threads e assim por diante.

O ideal é que este software verifique periodicamente o sistema e relate problemas: erros no log de erros do PHP, pacotes desatualizados, vulnerabilidades de segurança.

Em outras palavras, estou procurando um software que mantenha meu servidor Debian / Apache / PHP / MySQL simples, sem me forçar a monitorar os gráficos todos os dias.

    
por gWaldo 16.06.2010 / 11:22

6 respostas

1

Em contraste com o Zabbix - mencionado por Maxwell - é o venerável nagios (e é relativamente recente, icinga ). Esse framework existe há mais de dez anos e é incrivelmente estável - a única desvantagem é a instalação e a configuração, que consome muito mais tempo (principalmente na primeira vez) do que um sistema apoiado por uma empresa comercial como o Zabbix.

Ambos têm seu lugar no ecossistema, é claro - então sugiro que você experimente os dois. Como mencionado no meu comentário: o tipo de monitoramento mais aprofundado que você pretende fazer, mais você deve esperar para gastar esforço, seja escrevendo seus próprios plugins / scripts, ou pesquisando / baixando / modificando o trabalho dos outros. .

Boa sorte!

    
por 16.06.2010 / 13:39
1

Existem muitos softwares como esse, uma coisa a se notar é que você deve executá-lo em um host diferente ou você tem um alto risco de não ser notificado se algo der errado.

Como exemplo, usamos uma combinação de nagios (lida com todo o monitoramento e alerta, em outras palavras, é responsável por acordar alguém quando há alguma necessidade de um operador olhando para algo) e cactos (também pode fazer alerta) mas nós apenas a usamos para coletar e agregar várias métricas, variando de tráfego de rede a carga do sistema e estatísticas de spam de e-mail).

Quando chegar a hora de você receber um alerta (do nagios cacti zabbix whatever) ter alguns dados de desempenho para analisar (cacti, zabbix, os outros farão isso) geralmente ajudará você a diagnosticar onde está o problema.

Na pilha LAMP usual que você descreve as duas situações problemáticas mais comuns (na minha experiência, pelo menos) é o servidor HTTP ou SQL não respondendo de todo ou em um tempo razoável (um teste nagios irá verificar isso) ou carregar média no sistema indo muito alto.

Estas duas verificações provavelmente irão capturar 95% dos seus problemas, mas há muitas outras coisas que você deve procurar - exemplos:

  1. o apache trabalhando constantemente com o número máximo de processos / threads configurados significa que seu servidor não está acompanhando a carga
  2. sistema funcionando "ok", mas com uma unidade com falha no RAID (você não sabe com que frequência esse tipo de coisa passa despercebida por meses - ou pelo menos até a próxima falha de disco;)

Quase todos os produtos que você encontrará serão capazes de monitorar / representar graficamente tudo o que você pode lançar, geralmente você pode estendê-los através de simples scripts de shell, programas curtos e outros, além de seus instrumentos e ferramentas incluídos. o SNMP onipresente.

    
por 16.06.2010 / 14:30
0

A solução de monitoramento do Zabbix pode monitorar o que você quiser e acionar as ações de forma adequada, por exemplo, executar um script que processa logs e envia de volta o resultado, se necessário. Além disso, você pode acionar uma ação quando uma ou mais condições forem atendidas (como a saída do script de análise de log mostrando um erro e o carregamento da CPU em mais de 40%, por exemplo).

    
por 16.06.2010 / 11:31
0

Opsview é uma ferramenta de monitoramento totalmente integrada que incorpora o popular software Open Source, incluindo Nagios Core, Nagvis, Net-SNMP e RRDtool.

O framework web Catalyst fornece uma interface de usuário extensível de monitoramento e configuração. O software do servidor Opsview é executado no Linux e no Solaris 10. Ele monitora todos os sistemas operacionais comuns, incluindo Linux, AIX, Solaris e Windows.

Usando os milhares de plug-ins do Nagios disponíveis, o Opsview pode monitorar praticamente qualquer dispositivo, sistema ou componente de software.

A opinião analisa todos os aspectos do seu ambiente de TI, incluindo a maneira como eles trabalham com seus processos de negócios.

    
por 16.06.2010 / 13:38
0

Instalação do Nagios

O Nagios é um host e monitor de serviço projetado para informar sobre problemas de rede antes que seus clientes, usuários finais ou gerentes o façam. Ele foi projetado para ser executado no sistema operacional Linux, mas funciona bem na maioria das variantes também. O daemon de monitoramento executa verificações intermitentes nos hosts e serviços especificados usando plug-ins externos que retornam informações de status para o Nagios. Quando problemas são encontrados, o daemon pode enviar notificações para contatos administrativos de várias maneiras diferentes (email, mensagem instantânea, SMS, etc.). Ter uma instalação do Nagios no seu servidor ajudará a melhorar a confiabilidade do servidor.

O Nagios tem muitos recursos, tornando-se uma ferramenta de monitoramento muito poderosa. Algumas das principais características estão listadas abaixo: Monitoramento de serviços de rede (SMTP, POP3, HTTP, NNTP, PING, etc.) Monitoramento de recursos do host (carga do processador, uso de disco e memória, processos em execução, arquivos de log, etc.) Monitoramento de fatores ambientais como temperatura Tempo de inatividade programado para suprimir notificações de host e serviço durante períodos de interrupções planejadas Design de plug-in simples que permite aos usuários desenvolver facilmente suas próprias verificações de host e serviço Capacidade de definir hierarquia de host de rede, permitindo a detecção e a distinção entre hosts que estão inativos e aqueles que estão inacessíveis Suporte para implementar servidores de monitoramento redundantes e distribuídos Capacidade de reconhecer problemas através da interface da web Notificações de contato quando problemas de serviço ou de host ocorrem e são resolvidos (via e-mail, pager ou outro método definido pelo usuário) Escalonamento opcional de notificações de host e serviço para diferentes grupos de contatos Capacidade de definir manipuladores de eventos para serem executados durante eventos de serviço ou de host para resolução proativa de problemas Interface de comando externa que permite modificações dinâmicas no monitoramento e na notificação comportamento através do uso de manipuladores de eventos, da interface da Web e de aplicativos de terceiros Retenção do status do host e do serviço nas reinicializações do programa

    
por 16.06.2010 / 20:17
0

Dê uma olhada no Zenoss Core , um software de monitoramento gratuito e muito versátil, que muitas empresas usam para monitorar suas redes. É fácil configurar e começar a usar.

Muitos tipos de monitoramento e alerta são incorporados, incluindo gráficos de histórico. Os chamados ZenPacks podem ser instalados para ampliá-lo. Além disso, os plugins do Nagios podem ser adicionados.

Isso pode ser exatamente o que você precisa.

    
por 16.06.2010 / 20:32