Perguntas sobre o uso da CPU [closed]

0

Quão ruim / normal / bom é esse uso da CPU?

Cpu0  : 14.4%us,  6.3%sy,  0.0%ni, 78.8%id,  0.0%wa,  0.0%hi,  0.5%si,  0.0%st
Cpu1  : 88.3%us,  8.0%sy,  0.0%ni,  0.0%id,  0.0%wa,  0.0%hi,  3.7%si,  0.0%st

Recebemos alertas de uso da CPU que variam entre (80-88%) de um grupo específico de servidores (que manipula as partes mais importantes de nosso aplicativo) de vez em quando. Normalmente, não realizo ações porque vejo que a maior parte do uso está no %us space. Eu vejo isso como o sinal de um sistema saudável funcionando de maneira eficiente. Estou no processo de escrever um e-mail para a nossa equipe tentando explicar quando devemos entrar em pânico e quando não deveríamos nos alertas da CPU? Minhas perguntas são:

É justo dizer que, contanto que %wa e %sy não sejam muito altos, uma CPU com alto uso na coluna% us indica um sistema saudável do que um sistema lotado.

É correto pensar que até 95% do uso da CPU não é um problema com o servidor, contanto que esteja na coluna %us ?

Se o servidor estiver com 88% de uso da CPU em %us , estou certo em pensar que provavelmente o ajuste deve ser feito no aplicativo? Novamente, esse uso de 88% não está afetando o desempenho, então é melhor deixá-lo assim e aceitar o fato de que nosso aplicativo é altamente limitado pela CPU?

Esse servidor específico é executado no RHEL 6.5 e executa um processo java com mais de 800 segmentos na maioria das vezes.

    
por Sree 02.11.2014 / 14:53

1 resposta

2

Isso realmente parece ser o tipo de pergunta que você deve responder: mantenha estatísticas enquanto a máquina está operando normalmente por um tempo (por exemplo, uma semana), e isso lhe dará uma idéia de quais devem ser os parâmetros de operação normal.

Seu instantâneo mostra mais ou menos o máximo de um dos dois núcleos. Como o seu processo principal é multiencadeado, isso provavelmente significa que ainda há muito mais CPU para ser usado, se necessário.

Quanto a 85 ou 95% do usuário ser "muito alto", não é um problema para o sistema operacional, não. Eu acredito que é apenas um problema para o hardware, se isso levar ao superaquecimento da CPU. Obviamente, quanto mais você usar algo, mais provável será a chance de falha em um determinado período de tempo, mas isso não significa que o uso mais frequente tenha causado a falha. Por analogia: você poderia dirigir 1000 km por dia e ter seu carro quebrado depois de 13 semanas a ~ 100.000 km, ou você poderia dirigir 100 km por dia e ter seu carro quebrado após 2 anos a ~ 100.000 km. Em um computador, é muito mais provável que o hardware principal (com exceção do armazenamento e da memória) se torne obsoleto primeiro, não creio que seja particularmente propenso a gastar com o uso.

WRT para usuário versus tempo sys, o tempo excessivo do sistema pode ser indicativo de falha de hardware periférico. Isso provavelmente será em picos e, esperamos, acompanhado por mensagens de erro no log do sistema. Quanto ao quanto é demais, na maioria das vezes deve ser principalmente usuário. Novamente, manter as estatísticas por uma semana deve ajudá-lo a determinar isso.

    
por 02.11.2014 / 15:34