Carga de CPU muito alta, mas nada significativo no topo [duplicado]

12

Estou executando o Ubuntu Linux 12.04.1, com GPL VirtualMin 4.08.gpl e 2 núcleos de CPU.

Praticamente o tempo todo nas últimas semanas, ele está funcionando bem acima da média de carga de 5, geralmente mais perto de 10, às vezes chegando a 20.

Neste momento, médias de carga da CPU: 9,20 (1 min) 8,20 (5 min) 7,81 (15 min)

Ao mesmo tempo, o VirtualMin retorna:

Virtual Memory: 996 MB total, 15.44 MB used
Real Memory: 3.80 GB total, 972.43 MB used 
Local disk space: 915.94 GB total, 116.03 GB used

Reiniciei ( shutdown -rf now ) a máquina algumas vezes e, com certeza, mais cedo ou mais tarde, estaremos fazendo backup com altas cargas de CPU.

A execução de top (ou htop ) não retorna nada significativo em todas as execuções com CPU alta - na verdade, assistindo por alguns minutos e o item mais alto talvez tenha 3% de CPU.

Top retorna isso também:

Cpu(s): 2.2%us, 1.2%sy, 0.0%ni, 0.0%id, 96.5%wa, 0.0%hi, 0.2%si, 0.0%st

O %wa me preocupa como é tão alto - parece ficar acima de 80%. Eu entendo isso é% em espera, mas não tenho certeza o que isso significa em termos práticos.

Onde posso começar a depurar isso e descobrir o que está causando a alta carga de CPU?

    
por user1513196 04.06.2014 / 03:28

1 resposta

16

Essas não são "médias de carga da CPU", mas sim "médias de carga" do sistema. Isso não significa necessariamente que sua CPU esteja ocupada, mas algo em seu sistema é. Este valor vem de /proc/loadavg , que man proc explica com mais detalhes:

/proc/loadavg

The first three fields in this file are load average figures giving the number of jobs in the run queue (state R) or waiting for disk I/O (state D) averaged over 1, 5, and 15 minutes. They are the same as the load average numbers given by uptime(1) and other programs. The fourth field consists of two numbers separated by a slash (/). The first of these is the number of currently runnable kernel scheduling entities (processes, threads). The value after the slash is the number of kernel scheduling entities that currently exist on the system. The fifth field is the PID of the process that was most recently created on the system.

Então, o que você está vendo é a média do processo sendo executado ou aguardando o disco.

Se você estiver vendo uma média de carga de 20, isso significa que, em média, 20 processos estão no estado em execução ou em espera. Você pode ter uma média de carga muito alta e a CPU muito baixa, ou uma média de carga muito baixa e CPU muito alta, já que eles não compartilham nenhum relacionamento.

O %wa high pode ser algum processo destruindo o disco com uma frequência incomum que torna tudo mais lento, então descubra qual é o culpado, começando pelo processo D. O wa significa que o IO aguarda a maioria das implementações do top.

    
por 04.06.2014 / 03:40