Melhor maneira de monitorar uma grade de computadores?

2

Instalei o Sun Grid Engine em 10 nós e um host mestre virtual.

Agora tenho que monitorar todos os recursos antes de lançá-lo em produção, mas não sei qual é o melhor caminho. Eu tentei usar xml-qstat, mas parece instável.

Alguma dica ou sugestão?

Alguém tem experiência nisso?

obrigado.

    
por Marc Riera 21.04.2010 / 23:17

4 respostas

4

Você pode usar o Ganglia . Usamos o Ganglia com milhares de nós no Centro de Computação da Holanda e, na maior parte do tempo, parece funcionar razoavelmente bem, especialmente se você está procurando por gráficos históricos. O Nagios é usado para monitoramento ativo.

    
por 22.04.2010 / 00:07
1

Se eu estou entendendo corretamente, você precisa monitorar grupos de servidores de grade. Que tipo de monitoramento você tem em mente? Talvez algo como Nagios com algum script adicional possa atender às suas necessidades?

Existe um exemplo aqui .

    
por 21.04.2010 / 23:28
1

Apenas para o registro, também Munin ( link ) é muito bom.

    
por 07.01.2012 / 21:00
0

Parece que você está mais interessado em métricas do que tempo de atividade ou disponibilidade. Circonus ( link ) é um bom ajuste aqui. Você pode correlacionar virtualmente qualquer métrica, que pode ser importada através da DTD XML de Resmon.

    
por 14.05.2010 / 02:27