Monitorando e relatando falhas de página para determinar problemas de memória

1

Estou no processo de configurar um monitor de desempenho contra todos os servidores no meu domínio. Estou usando o WhatsUp Gold 16.2 para enviar um alerta quando atingimos determinados limites. Eu li recentemente um artigo da Microsoft que até 150 páginas / segundo era um limite aceitável. O problema com o WUG é que a menor unidade que eu posso medir é um minuto. Pensei em multiplicar 150 * 60 e enviar um alerta em 9000, mas isso não parece ser uma boa indicação da pressão da memória

Um dos meus administradores de sistema criou um monitor para enviar um alerta, uma vez que tivemos mais de 4000 falhas de página em 30 minutos. Eu não acho isso melhor do que o meu monitor proposto acima.

Um exemplo do monitor de falhas de 4000 páginas:

Física, não uma VM Server 2003 R2 com SP2 Funciona como um controlador de domínio em um escritório remoto 32 bits 4 GB de RAM Arquivo de paginação de 4 GB 2 procs 2.8GHz

Gráfico de 30 dias da RAM: Média: 18,5% Max: 26,6%

Gráfico de 30 dias da memória virtual: Média: 5,38% Máximo: 6,66%

O sistema acima disparou um alerta com mais de 4400 falhas de página em 30 minutos. É óbvio pelas estatísticas que não há pressão de memória para falar, nem o monitor de falha de 4000 páginas é um bom indicador de um problema.

A maior parte do meu ambiente é virtual (VMWare e Hyper-V), principalmente VMWare. A maioria dos servidores é uma variação do Server 2008, muito poucos de 2003 e vários de 2012. Pouquíssimos são físicos.

Minha pergunta realmente se resume a:

O que devo monitorar e qual limite disparar um alerta com uma taxa de amostragem de um minuto?

    
por Sean Perkins 02.04.2014 / 00:19

0 respostas