Server Performance

3

Temos um servidor dedicado que usamos para criar websites (nosso servidor de teste). O desempenho do servidor se tornou muito ruim e nós regularmente temos que reiniciá-lo. Quando o desempenho é ruim, verifiquei o gerenciador de tarefas para os processos e a memória, mas tudo parece OK.

Usamos um sistema de gerenciamento de conteúdo e é sempre ao usar a seção administrativa deste CMS que percebemos que o desempenho é degradado, o que me faz pensar que pode ter algo a ver com as chamadas ao DB que o CMS está fazendo.

Isso soa viável? Alguma outra sugestão de como posso fazer isso?

Obrigado antecipadamente ...

    
por Burt 22.12.2010 / 12:16

3 respostas

5

Does this sound viable?

Sim.

Any other sggestions of how I can go about testing this?

Verificação de desempenho. Note que o desempenho não é apenas CPU. Se você acha que o banco de dados é o problema, ele pode ser vinculado a E / S - a latência do disco / a porcentagem de atividade disparará neste caso. Verifique os contadores de desempenho do disco. Especialmente se você for IO buond, a CPU será baixa, já que a CPU basicamente não atende aos processos, porque é a espera para o IO terminar.

Cada vez mais ocupado, os bancos de dados exigem orçamentos de IO significativos, o que significa alguns discos. Eu tenho um banco de dados aqui que usa 6 discos de 10k RPM agora e logo é atualizado para 8 - SOMENTE para os dados. Um servidor dedicado barato típico geralmente tem orçamentos de IO muito ruins - discos lentos de usuários finais grandes, poucos deles, não fazem um subsistema rápido. Isso funciona muito bem em alguns cenários, mas no final pode estar sobrecarregado.

    
por 22.12.2010 / 12:43
5

Como a TomTom disse, isso é quase certamente uma indicação de que o seu sistema está vinculado a E / S não vinculado à CPU. A causa raiz pode ser apenas o aumento da carga DB por trás do seu CMS ou pode ser outra coisa, mas em qualquer caso, o PerfMon tem alguns contadores úteis para analisar que podem determinar se o subsistema de disco é a causa.

\ LogicalDisk \ Avg. Disco Sec / Ler e \ LogicalDisk \ Avg. Disk Sec / Write
Estes são seus números básicos de latência para operações de leitura e escrita de E / S, quanto menor, melhor. Sempre que estes números excederem cerca de 15 ms, o desempenho do servidor será notoriamente fraco.

\ LogicalDisk \ Disk Bytes / Sec e \ LogicalDisk \ Disk Reads / Sec e Isso lhe dirá o rendimento total do disco. Essas taxas podem estar saturando a capacidade máxima do subsistema de disco devido ao throughput sozinho ou porque você atingiu um limite de IOPs para seu padrão de leitura / gravação. Pode ser difícil deduzir algo significativo disso, a menos que você esteja 100% confiante de que você tem um padrão de IO previsível. Não há uma maneira realmente útil de fornecer qualquer número específico a ser observado aqui, mas se você estiver vendo de 50 a 100 MBytes / s ou mais de um único disco SATA que seria o melhor que você poderia esperar. Discos de servidor mais rápidos (10k, 15K, SSD) podem exceder isso e o armazenamento conectado à SAN pode fornecer praticamente tudo o que você desejar, desde que você pague o suficiente. Com um pequeno IO aleatório (típico de operações de banco de dados), esse número sempre será baixo e não lhe diz muito.

\ LogicalDisk \ Gravações de disco / Sec, \ LogicalDisk \ Leituras de disco / seg e \ LogicalDisk \ Transferências de disco / s Eles informarão o número de operações de E / S discretas por segundo e a taxa de leitura / gravação. Os discos giratórios são relativamente limitados nesse sentido - discos SATA de 7,2K podem sustentar por volta de 70 a 80 IO por segundo, discos de 10K empurram isso para a faixa de 100-150, 15K serão 200+. SSDs será uma ordem de magnitude ou dois maior. Grupos de RAID aumentam isso de forma bastante linear para leituras, mas o Writes incorrerá em uma penalidade entre 2 e 5. Um pacote RAID 5 de 3 unidades (com uma penalidade de gravação de 4) suporta cerca de 25% menos E / S de gravação do que uma única unidade, por exemplo.

Se esse número tende a aumentar enquanto a latência está aumentando em território perigoso (ou seja, > 15 ms), é uma strong indicação de que seus discos estão atingindo um limite de IOPs, independentemente dos números específicos relatados.

\ LogicalDisk \ IO dividido / seg Isso informará quantas solicitações de E / S resultarão em várias operações e fornecerão uma noção da quantidade de fragmentação que está afetando a atividade de E / S.

PhysicalDisk: Comprimento atual da fila de disco e PhysicalDisk: média Comprimento da fila de disco. Isso informa quantos Ops pendentes estão aguardando para serem concluídos no nível do disco físico. Se este for 2 ou superior em um único disco, ou exceder o número de discos no grupo de RAID do qual o disco foi construído, você poderá estar enviando mais I / O para o disco do que ele pode concluir em tempo hábil. Há situações em que isso não importa muito, mas será um verdadeiro matador para sistemas que exigem IO de disco de baixa latência (bancos de dados em que o cache de memória não pode cobrir a fraqueza dos discos). A primeira é uma leitura instantânea, então só se preocupe se for consistentemente alta ou se mudar de acordo com o contador de tempo do disco%. Se a média O Comprimento da Fila de Disco é muito alto, então você definitivamente tem um problema.

PhysicalDisk:% de tempo em disco % Tempo de disco informa a movimentação do disco. À medida que se aproxima de 100%, você terá dificuldades para fazer com que o sistema faça qualquer outra coisa que dependa desse disco, já que todos os pedidos de veiculação adicionais tendem a ser enfileirados. Números pares significativamente abaixo de 100% podem indicar um problema e, se esse valor for alto ou crescente, e o comprimento da Fila de disco atual for alto, isso é uma indicação clara de um carregamento de E / S que excede a capacidade dos discos. Este número é realmente calculado de uma maneira estranha e, como resultado, pode não ser tão útil na análise do desempenho do RAID.

Este artigo do blog da Technet entra em um muito mais profundidade em alguns desses contadores e alguns cenários onde você pode usá-los para identificar o problema e estabelecer como corrigi-lo.

    
por 22.12.2010 / 15:29
0

Vale a pena considerar a configuração do seu pool de aplicativos da Web para reciclar os processos de trabalho com frequência?

    
por 22.12.2010 / 12:55