Existem muitas respostas. Eu pessoalmente uso o Zenoss , mas há uma lista grande aqui: link
O servidor dedicado que estou procurando começou a travar ocasionalmente, eu suspeito por causa da sobrecarga, então eu preciso de algum software de monitoramento baseado em desempenho / recurso, de preferência com interface web, algo como OpenNMS que eu tentei, mas não gostei . O sistema operacional é Linux CentOS 5.3
P.S. Existem mais de 50 sites em execução no servidor, se o software de monitoramento puder mostrar qual deles está consumindo a maioria dos recursos que seriam mais úteis.
Eu recomendaria usar dois softwares para fazer o monitoramento:
Eles farão tarefas complementares de monitoramento ao vivo e uso de recursos históricos. Se você quiser, pode integrá-los para ter uma única fonte de alertas.
Você deve usar nagios com nrpe plugins para verificar o estado e disponibilidade do servidor web.
htop
para monitoramento local e apache-top se você estiver usando o apache.
monit é um software de monitoramento e gerenciamento de recursos bem projetado e modular, que permite monitorar processos do servidor e executar ações causais significativas (por exemplo, reiniciar um processo, enviar alerta etc.) em situações de erro. Ele também tem uma amigável interface de usuário que você pode acessar via protocolo HTTP.
Ele vem com vários módulos para diferentes protocolos e você pode conectá-lo facilmente ao seu servidor.
Existe também uma versão comercialmente suportada que tem mais capacidades.
Nagios , como outros já mencionaram, é uma infraestrutura de código aberto para monitorar sistemas remotos a partir de um servidor central. Os sistemas remotos relatam o estado de "serviço" através de uma mensagem simples, e o servidor de monitorização central quer "activamente" pedir esse estado através de uma ligação directa ou o sistema remoto reporta-o "passivamente", e. sobre http. (As palavras citadas são a terminologia do Nagios.) O servidor central é configurado usando um conjunto de arquivos de texto que definem os hosts remotos, serviços, programação, etc.
Esta é uma breve descrição do que o Nagios oferece, no entanto, dá uma idéia do tipo de infra-estrutura a ser esperada. A força do Nagios vem da simplicidade da mensagem de status. Um "serviço" é qualquer coisa que relate um status no formulário que o Nagios pode ingerir. Pode ser escrito em qualquer idioma, em qualquer plataforma. Muitas extensões foram desenvolvidas e estão disponíveis na biblioteca do Nagios.
A versão comercial é chamada Nagios XI, e coloca um bom front-end sobre os arquivos de configuração, usando um banco de dados para armazenar os metadados e o módulo de gráficos baseados em RRDTool para gerar relatórios.
Estamos usando o Nagios XI por cerca de seis meses. Definitivamente, há uma curva de aprendizado, e a GUI administrativa precisa de algum trabalho para lidar com instalações em grande escala, mas estamos satisfeitos com o custo-benefício.
Existem várias ferramentas de monitoramento e software de código aberto e comercial. O Nagios é bastante popular, mas é difícil configurar ... isso vale para o OpenTSDB. Se você administra um negócio (parece que é com os sites), recomendo investir em softwares comerciais como o Metrink ou o New Relic. Eles podem ser caros, mas valem a pena para ajudar a manter seu negócio funcionando.
Você pode experimentar o SeaLion . É uma ferramenta de monitoramento de servidor Linux baseada em nuvem. Funciona muito bem no CentOS 5.1 (estou usando). Você pode querer verificar a dependência python embora (2.6+). Quando isso é feito, é uma moleza. A instalação demora apenas alguns segundos e a interface do usuário é limpa e simples. Ele dá uma visão panorâmica de todos os servidores, então será de grande utilidade para você.
Nagios - link
Tags monitoring centos software-rec