Diagnosticando alta espera da CPU

4

Eu tenho um servidor de monitoramento que está executando o icinga / collectd / graphite com cerca de 50 hosts. Eu notei alta carga / desempenho de slugging na caixa. Se você der uma olhada no topo, você verá:

Cpu (s): 0,6% us, 0,2% sy, 0,0% ni, 7,6% id, 23,4% wa, 0,0% hi, 0,2% si, 0,0% st

Observe o valor HUGE% wa, que, até onde eu sei, significa um gargalo na rede ou no disco. O ifconfig não mostra pacotes perdidos e não há uma tonelada de largura de banda acontecendo, então isso deixa problemas de disco, certo? Não há muita escrita em disco acontecendo ... o iotop está relatando que estamos apenas escrevendo um pouco mais de 1 MB por segundo e a ferramenta RAID relata que tudo é A-OK e o cache de gravação está ativado.

Como faço para tentar descobrir como consertar isso?

ATUALIZAÇÃO: A saída iostat -x é:

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.62    0.10    0.31    9.65    0.00   89.31

Device:         rrqm/s   wrqm/s     r/s     w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util
sda               0.21    33.34   83.55   16.54  1599.94   399.07    19.97    43.21  416.98   3.71  37.13
    
por Will 07.06.2012 / 15:00

2 respostas

2

A espera de E / S também é gerada pelo NFS, SMB e outros sistemas de arquivos remotos.

Use vmstat 2 para ver uma visualização granular do desempenho do sistema, incluindo io wait.

    
por 27.09.2012 / 23:35
1

Alta wa geralmente significa que o SO está aguardando por rede ou disco. Existe um programa bacana chamado iotop . Isso informa o que o disco está fazendo, pode ser de alguma ajuda.

    
por 07.06.2012 / 15:49