Load Average acima de 20 para vps single core no debian [closed]

5

SO: Debian 6.0 RAM: 3072 M, CPU: single core.

top:

top - 08:56:43 up 21 days, 12:37,  1 user,  load average: 28.38, 22.48, 15.95
Tasks:   8 total,   1 running,   7 sleeping,   0 stopped,   0 zombie
Cpu(s):  6.3%us, 14.7%sy,  0.0%ni, 17.5%id, 57.0%wa,  0.1%hi,  4.4%si,  0.0%st
Mem:   3145728k total,    28144k used,  3117584k free,    10236k buffers
Swap:        0k total,        0k used,        0k free,        0k cached
  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
 1247 root      20   0 18932 1240 1000 R    0  0.0   0:00.06 top
    1 root      20   0  8356  724  676 S    0  0.0   7:41.97 init
 3277 root      20   0  208m  11m 5652 S    0  0.4   0:00.17 apache2
 3847 root      20   0 22420 1032  788 S    0  0.0   0:12.66 cron
 8809 www-data  20   0  208m 7400 1168 S    0  0.2   0:00.00 apache2
26429 root      20   0 70488 3368 2652 S    0  0.1   0:00.80 sshd
26539 root      20   0 19300 2124 1564 S    0  0.1   0:00.16 bash
29551 root      20   0 49168 1152  604 S    0  0.0   0:00.12 sshd

ps aux:

USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root         1  0.0  0.0   8356   724 ?        Ss   Jul23   7:41 init [2]
root      3277  0.0  0.3 213808 11828 ?        Ss   08:17   0:00 /usr/sbin/apache2 -k start
root      3847  0.0  0.0  22420  1032 ?        Ss   Jul23   0:12 /usr/sbin/cron
root      5870  0.0  0.0  16332  1140 pts/10   R+   08:58   0:00 ps aux
www-data  8809  0.0  0.2 213944  7400 ?        S    08:32   0:00 /usr/sbin/apache2 -k start
root     26429  0.0  0.1  70488  3368 ?        Ss   08:13   0:00 sshd: root@pts/10
root     26539  0.0  0.0  19300  2124 pts/10   Ss   08:13   0:00 -bash
root     29551  0.0  0.0  49168  1152 ?        Ss   Jul23   0:00 /usr/sbin/sshd

Como posso descobrir o processo que está causando o problema? Depois de algum tempo, a média de carga está diminuindo, mas alguém pode me ajudar a encontrar a causa desse comportamento?

update: load-average 233

top - 10:29:01 up 21 days, 14:09,  2 users,  load average: 237.96, 183.80, 98.76


Tasks:  15 total,   1 running,  14 sleeping,   0 stopped,   0 zombie

Cpu(s):  9.3%us, 14.2%sy,  0.0%ni,  0.0%id, 72.0%wa,  0.0%hi,  4.6%si,  0.0%st

Mem:   3145728k total,    51408k used,  3094320k free,    10272k buffers

Swap:        0k total,        0k used,        0k free,        0k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND

    1 root      20   0  8356  724  676 S    0  0.0   7:44.70 init

 2031 root      20   0 70592 3388 2652 S    0  0.1   0:00.14 sshd

 2664 root      20   0 19300 2120 1556 S    0  0.1   0:00.02 bash

 3277 root      20   0  210m  11m 5680 S    0  0.4   0:00.57 apache2

 3847 root      20   0 22420 1032  788 S    0  0.0   0:12.70 cron

 4041 www-data  20   0  211m 7792 1228 S    0  0.2   0:00.00 apache2

13767 root      20   0 32800 1112  812 S    0  0.0   0:00.01 cron

14742 smmsp     20   0 52508 3940 2632 D    0  0.1   0:00.00 sendmail

15769 root      20   0 69232 3092 2408 S    0  0.1   0:00.01 sshd

16154 www-data  20   0  211m 7716 1228 S    0  0.2   0:00.00 apache2

17260 sshd      20   0 50616 1372  728 S    0  0.0   0:00.00 sshd

18436 root      20   0 18932 1248 1004 R    0  0.0   0:00.02 top

26429 root      20   0 70488 3376 2652 S    0  0.1   0:01.11 sshd

26539 root      20   0 19300 2124 1564 S    0  0.1   0:00.29 bash

29551 root      20   0 49168 1152  604 S    0  0.0   0:00.14 sshd
    
por ananthan 14.08.2012 / 09:09

2 respostas

13

Seu servidor está gastando uma quantidade excessiva de tempo na espera de E / S.

57.0%wa

Isso significa ... disco.

Uma causa provável desse problema é que o servidor em que o seu VPS é executado está tendo problemas com o (s) disco (s). Esses problemas incluem, mas não estão limitados a: um disco com falha; usando discos de nível não empresarial; seu host tentando executar um negócio VPS em hardware reciclado de forma criativa, etc.

Também pode ser que você esteja executando um processo que está causando quantidades anormalmente altas de atividade de disco. Infelizmente essa informação não é reportada na sua listagem top ou ps , fazendo-me suspeitar que você tem um VPS baseado em OpenVZ de baixo custo. (Que, se for verdade, coloca você de volta no parágrafo anterior.)

Quanto a resolver o problema, a primeira coisa a fazer é excluir qualquer um dos processos que causem grandes quantidades de atividade no disco. O programa iotop , como mencionado por @Shi, é bom para isso. Embora minha aposta seja que você não encontrará nada. Uma vez feito isso, entre em contato com o host para relatar algum problema com o disco do servidor que ele terá que diagnosticar, já que ele é o host e você não pode ver isso de dentro do contêiner.

(E mais tarde, quando você está comprando um novo provedor de VPS, fique longe de qualquer um que use o OpenVZ. Minha experiência é que a grande maioria deles é executada muito mal.)

    
por 14.08.2012 / 09:32
5

Primeiro, tente entender a linha abaixo:

Cpu(s): 6.3%us, 14.7%sy, 0.0%ni, 17.5%id, 57.0%wa, 0.1%hi, 4.4%si, 0.0%st

Você vê que a CPU para aplicativos de espaço do usuário (% us) não faz quase nada. Está ocupado com tarefas do sistema (kernel) (% sy) e ainda mais com a espera (% wa).

Esperar geralmente significa que a E / S (entrada / saída) está aguardando. Portanto, verifique as estatísticas de entrada / saída usando iotop .

Como a troca está desabilitada, a troca não está causando isso.

    
por 14.08.2012 / 09:15

Tags