alta carga no servidor Nagios - Quantos cheques de serviço para um servidor Nagios é demais?

9

Eu tenho um servidor nagios rodando o Ubuntu com um processador Intel 2.0 GHz, um array RAID10 e 400 MB de RAM. Ele monitora um total de 42 serviços em 8 hosts, a maioria dos quais são verificados usando o plugin check_http mesmo 5 minutos, alguns a cada minuto. Recentemente, a carga no servidor nagios tem sido acima de 4, geralmente tão alta quanto 6. O servidor também executa cactos, reunindo estatísticas a cada minuto para 6 hosts.

Eu me pergunto, quantos serviços um hardware como esse deve ser capaz de manipular? A carga é tão alta porque eu estou empurrando os limites do hardware, ou esse hardware deve ser capaz de lidar com 42 verificações de serviço mais cactos? Se o hardware for inadequado, devo procurar adicionar mais RAM, mais núcleos ou núcleos mais rápidos? Quais verificações de hardware / serviço são outras executadas?

    
por Josh 28.01.2010 / 18:13

4 respostas

7

Você precisa descobrir onde está o seu gargalo ...

Eu corro um monitor nagios que verifica mais de 400 hosts com verificações http, ping e ssh. (juntamente com muitas outras verificações passivas e nscd)

Isso está em um servidor 2xQuadCore com 4 discos SAS no RAID10.

Eu suspeito que você esteja tendo contenção de IO, já que escrever para muitos rrds é muito ineficiente.

Você precisa descobrir qual processo está ocupando seus recursos. (cactos, nagios ou outra coisa)

Para a verificação de E / S, gosto do iotop. Instale o iotop (o pacote 9.04 funciona em 8.04)

Caso contrário, o top também deve ajudá-lo a encontrar o seu porco de carga.

O Cacti uma vez por minuto é bastante agressivo. (Eu corro o meu em intervalos de 5m)

Uma abordagem da qual ouvi falar para a contenção de escrita rrd é colocar suas lojas rrd em um ramdisk / tmpfs. (Certifique-se de rsync que de vez em quando para armazenamento persistente)

Boa sorte.

    
por 28.01.2010 / 19:21
6

A menos que o cacti gere a maior parte da carga, você poderá executar muito mais verificações do que no seu hardware.

Estou executando nagios em uma máquina virtual FreeBSD rodando no Microsoft Virtual Server em um PC antigo lento (Pentium 3 1GHz com um disco PATA lento). A máquina virtual tem apenas 128MB de RAM e o desempenho é terrível.

No entanto, a média de carga é de cerca de 0,2, executando 158 verificações em 42 hosts.

    
por 28.01.2010 / 18:21
2

Em um antigo PIII com 256MB de RAM, estou monitorando ativamente cerca de 230 serviços diferentes. A mesma máquina também está executando o MRTG e o HylaFAX para todos os nossos faxes recebidos e está fazendo isso de maneira bastante confortável.

    
por 28.01.2010 / 22:12
1

Você deve ser capaz de executar um grande carregamento de verificações de nagios com esse hardware. Nós rodamos uma configuração similar com cerca de 70 checks e Nagiosgraph - a principal diferença é a RAM adicionada (é barato, então eu aumentava a caixa para 2Gb).

Tente executar top ou ps -aux para ver se a CPU está sobrecarregada, mas duvido. Você também pode verificar os documentos de paralelização do nagios para ver se sua instalação está tentando executar muitas verificações ao mesmo tempo em vez de serializá-los.

    
por 28.01.2010 / 19:58