Em termos de flexibilidade, você não pode bater o plugin snmp. Está por trás de quase todos os cheques que eu corro e, se não for, a conexão TCP é.
Estamos expandindo nossa configuração do Nagios 3 e estamos frequentemente encontrando novos plug-ins NRPE ou Nagios gerais para testar nossa infraestrutura existente. Isto está em dribs e drabs embora - seria útil obter um resumo dos plugins que os usuários do Nagios mais valorizam.
Por favor, liste um único plugin por post, de preferência com uma breve descrição do motivo pelo qual você adora e um link para o MonitoringExchange ou site de desenvolvedores de plugins. Desta forma, as pessoas podem votar em plugins já listados e podemos vê-los em ordem preferencial.
Seria melhor não listar plugins que outros já mencionaram, pelo mesmo motivo. Se você tiver mais a adicionar em relação a um plug-in listado por outra pessoa, deixe um comentário em sua resposta.
Obrigado!
Em termos de flexibilidade, você não pode bater o plugin snmp. Está por trás de quase todos os cheques que eu corro e, se não for, a conexão TCP é.
Nossos plugins mais úteis são aqueles que testam nossa maior funcionalidade de aplicativos. Por exemplo, temos testes que tentam entrar no site e testes que tentam enviar um e-mail e checar uma caixa de correio pop3 para ter certeza de que ela chegou. Se alguma dessas coisas quebrar, podemos usar verificações de nível inferior para ver o que está errado. O pop3 está morto? o MTA, o MDA? O servidor de banco de dados? o armazenamento de dados?
Honestamente, o que mais faz por mim é o antigo check_disk
. Nada me faz sentir tão especial, nesse jeito de "parar de comer a pasta", pois ter um servidor que estava funcionando bem explodiu, correndo como um louco e depois descobrindo que é porque eu deixei os discos se encherem. Nunca ter que fazer isso de novo na minha vida vale muito para mim.
(E não esqueça de checar os inodes, também, crianças assistindo em casa.)
WebInject é muito útil para monitorar sites da Web se você quiser ir além da funcionalidade check_http; ele pode manipular páginas de login e executar várias etapas em uma verificação do Nagios.
Eu acho que check_nfsmount é útil em muitos dos meus servidores.
Edit: Eu também votaria no check_snmp se eu tivesse o representante para fazer isso. Ele está em uso em todos os meus servidores, além da lógica por trás do check_hpjd, que estou executando em todas as minhas impressoras HP.
Minha mais útil é aquela que eu mesmo escrevi e que verifica os certificados SSL em nossos servidores da Web para que eu possa ficar de olho no vencimento.
check_nt (conversando com o NSClient ou algo similar no assunto) permite interrogar o WMI em uma caixa do Windows - se houver um contador de desempenho para ele, você pode agora monitorá-lo com o Nagios.
PNP (pnp4nagios.org) - gera gráficos no estilo da RRD para qualquer verificação do Nagios que produza o desempenho. dados. Awesomely útil, especialmente ao tentar convencer os desenvolvedores que o serviço recém-instalado é realmente a causa de todos os picos de CPU ...
Este é um plug sem vergonha, mas se você estiver monitorando máquinas Windows usando NRPE, NagiosPluginsNT parece funciona muito bem. ; -)
Eu concordaria que check_snmp é um plugin extremamente valioso; Ele pode ser usado para praticamente qualquer finalidade e tudo aparece no SNMP em geral. O SNMP está disponível em sistemas tão diversos quanto HP-UX, Tru64 e OpenVMS sem instalações adicionais.
Outro plugin (não muito) que é muito útil é o NagiosGrapher; Eu tenho minha experiência em um artigo que explica mais, mas também para que outros possam usá-lo sem quaisquer dificuldades que eu experimentei.
Um último: NSCA. Você pode escrever um script Perl ou Ruby ou ksh e alimentar a saída no NSCA.
Entre as flexibilidades do NSCA e do SNMP combinadas com o relatório do NagiosGrapher, isso deve expandir muito bem o seu monitoramento.
Eu gosto do check_http para verificar se meus sites ainda estão funcionando, expandi-lo para verificar se determinado texto pode ser encontrado após uma vez que minha empresa de hospedagem decidiu veicular páginas em branco e todas as verificações do nagios foram aprovadas enquanto o servidor ainda estava correndo.
O mais útil para mim é aquele que escrevi para as minhas necessidades: nagios-check-page
Faz o download de uma página inteira com js / css / images, com multi-threads e gzip (salva muita banda), como navegadores reais.
O número um é o NagiosWSC Ele permite que você faça o monitoramento sem agente dos hosts do Windows pelo WMI
Um que verifica a latência real para acessar sites e verifica se há uma tag oculta 'status: ok'. Ele pegou um problema com nosso cache de squid e um problema no conjunto de idiomas que acontecia apenas uma vez em algumas noites às 3 da manhã, quando alguém acessava o site com um navegador que solicitava uma versão internacionalizada da página em inglês.
Sério, configure todo tipo de monitoramento que você puder. Os estranhos bugs e erros que você pode pegar em um ambiente complexo com um bom monitoramento é incrível. Além disso, registre seus dados de desempenho em um banco de dados rrd e exiba-os no Cacti.
Um dos plugins mais importantes é o que eu mesmo escrevi: check_rdiff_backup. Eu faço backups no exterior, e Nagios me diz se e quando algo acontece com eles.
Se você está procurando por um plug-in rdiff-backup, existe um que você pode encontrar no Google.
check_curl para mim tem sido uma dádiva de Deus. Realmente fez a diferença para a flexibilidade de fazer verificações de sites, e também achei muito mais fácil do que o webinject, com quase todas as mesmas funcionalidades que eu precisava
Não é estritamente um plugin, mas obter o twurl ( link ) para funcionar como um meio de desencadear alertas foi uma dádiva absoluta. Não há necessidade de alertas SMS e apenas satisfazendo todo.
Detalhes sobre como foi feito: Alertas do Nagios usando o twitter (com twurl) não disparando - desculpas pela autopromoção descarada;)
Outras coisas ...
Check_diskio ( link ) foi incrivelmente útil em conjunto com a carga e processo padrão da CPU número de cheques para determinar quando / se o pedido de veiculação está vinculado e de que maneira. Usar o nagiosgraph ( link ) torna ainda mais fácil.
Bem, os simples, simples e padrão - check_disk, check_load, check_http são perfeitos o suficiente para a maioria dos casos (principalmente queremos saber se servidores, sites estão funcionando corretamente)
e diferente de check_disk e check_swap, há uma check_memory link que dá o usuage de memória ...
Centreon definitivamente para gráficos e todos os recursos do Nagios!
check_multiprocs usados com check_nrpe texto do link
Isto é uma espécie de trapaça, porque eu fiz muito desenvolvimento sobre ele, e ele realmente verifica muitas coisas diferentes de uma só vez, mas o 'plugin' mais útil para os nagios é Resmon . É um agente que você executa no próprio servidor, e o nagios se conecta via http para executar as verificações. Eu acho que é semelhante ao que o nrpe faz, mas com várias decisões de design diferentes.
Eu tinha usado dois plugins ... um era fornecer feed XML dos alertas e outro para enviar alertas via twitter. Ambos eram úteis (além dos plugins regulares). se você contar o NRPE como um plugin, adicione-o também.
check_apt é muito legal e me lembra de atualizar meus servidores Debian.
Recentemente, comecei a usar o plug-in check_multi , usando um patch / enrescentada NRPE para saída grande (devido a HTML e informações de desempenho). É quase "um plugin para governar todos"! ; -)