Alguém pode explicar a relação de afunilamento da CPU no AIX em relação a lcpu e r?

0
# vmstat 60 2
System configuration: lcpu=12 mem=46080MB ent=1.10

kthr    memory              page              faults              cpu          
----- ----------- ------------------------ ------------ -----------------------
r  b   avm   fre  re  pi  po  fr   sr  cy  in   sy  cs us sy id wa    pc    ec
9  3 10845919 385420   0   0   0   0    0   0 5693 199747 54772 52 35  8  5  2.79 253.6
11  3 10855682 393324   0   0   0   0    0   0 6053 200390 51913 57 34  5  4  2.90 263.5

Embora o uso médio da CPU tenha sido de 95% (veja a coluna "ociosa"), a CPU ainda não é o gargalo, já que "r" era menor que "lcpu".

link

If runnable threads (r) divided by the number of CPU is greater than one -> possible CPU bottleneck (The (r) coulmn should be compared with number of CPUs (logical CPUs as in uptime) if we have enough CPUs or we have more threads.) High numbers in the blocked processes column (b) indicates slow disks. (r) should always be higher than (b); if it is not, it usually means you have a CPU bottleneck

Pergunta : Alguém pode explicar isso um pouco mais detalhadamente? Por que podemos dizer que este sistema ainda não precisa de mais CPU (r < lcpu)?

    
por LoukiosValentine79 19.04.2016 / 18:08

2 respostas

0

De acordo com a documentação da IBM [1], o campo r mostra o número de encadeamentos executáveis , precisamente, o número de encadeamentos já em execução + número de encadeamentos aguardando em uma fila.

Portanto, se r < lcpu , significa que todos os encadeamentos estão na CPU e você não tem encadeamentos esperando em uma fila. No seu caso, 11 threads estão rodando, e você ainda tem 1% de reposiçãolcpu.

Digamos que r = 20 . Nesse caso, você está tendo gargalo da CPU, porque haveria 12 encadeamentos na CPU + 8 encadeamentos aguardando na fila para que a sua vez fosse agendada. E o uso da CPU seria de 100%.

[1] link

    
por 22.04.2016 / 21:54
0

Para referência, geralmente é melhor, pelo menos, executar vmstat -wtI 5 3 ( -w fornece uma saída ampla, -t fornece carimbos de data e hora para facilitar a correlação dos números com outros resultados de monitoramento de desempenho que você pode executar em paralelo e -I fornece colunas adicionais para página de arquivo / pageout) à medida que você o executou por 60 segundos e apenas observando a saída do vmstat pelo tempo você está olhando não é realmente suficiente.

Você também deve sempre fornecer a saída de lparstat -i para comparação e colocar as informações no contexto (CPU limitada / limitada, dedicada ...)

    
por 25.04.2016 / 17:58