Esse bug é documentado no link e até agora a solução é desabilitar o acpi_pad
Nos meus sistemas (IBM Flex x240) isto acontece depois de desabilitar o Hyperthreading.
Eu tenho uma nova estação de trabalho com uma média de carga alta incomum. As especificações da máquina são:
Instalei o CentOS 6.5 de 64 bits a partir do live cd, configurei as partições (usando LVM), a rede, os usuários / grupos e instalei alguns softwares como ferramentas de desenvolvimento e MATLAB. A média de carga da estação de trabalho, após alguns minutos da inicialização, tem um valor que varia de 0,5 a 0,9. Mas não está fazendo nada. Assim, não consigo entender por que a média de carga é tão alta.
Você poderia me ajudar a diagnosticar esse problema?
Aqui estão algumas informações:
uname -a
Linux delta.grid 2.6.32-431.el6.x86_64 #1 SMP Fri Nov 22 03:15:09 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux
topo
top - 15:44:53 up 22 min, 1 user, load average: 0.84, 0.69, 0.39
Tasks: 729 total, 1 running, 728 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 264422908k total, 1986152k used, 262436756k free, 25640k buffers
Swap: 134217720k total, 0k used, 134217720k free, 147784k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
4094 root 20 0 15564 1764 944 R 0.3 0.0 0:01.44 top
1 root 20 0 19364 1536 1228 S 0.0 0.0 0:01.26 init
2 root 20 0 0 0 0 S 0.0 0.0 0:00.01 kthreadd
3 root RT 0 0 0 0 S 0.0 0.0 0:00.27 migration/0
4 root 20 0 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/0
5 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/0
6 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/0
7 root RT 0 0 0 0 S 0.0 0.0 0:00.14 migration/1
8 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/1
9 root 20 0 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/1
10 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/1
11 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/2
12 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/2
13 root 20 0 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/2
14 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/2
15 root RT 0 0 0 0 S 0.0 0.0 0:00.03 migration/3
16 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/3
17 root 20 0 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/3
18 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/3
19 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/4
20 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/4
21 root 20 0 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/4
22 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/4
23 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/5
24 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/5
25 root 20 0 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/5
26 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/5
27 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/6
28 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/6
29 root 20 0 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/6
30 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/6
31 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/7
32 root RT 0 0 0 0 S 0.0 0.0 0:00.00 migration/7
free -m
total used free shared buffers cached
Mem: 258225 1939 256286 0 25 144
-/+ buffers/cache: 1769 256455
Swap: 131071 0 131071
iotop
Total DISK READ: 0.00 B/s | Total DISK WRITE: 0.00 B/s
TID PRIO USER DISK READ DISK WRITE SWAPIN IO> COMMAND
1 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % init
2 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [kthreadd]
3 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/0]
4 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/0]
5 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/0]
6 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/0]
7 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/1]
8 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/1]
9 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/1]
10 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/1]
11 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/2]
12 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/2]
13 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/2]
14 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/2]
15 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/3]
16 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/3]
17 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/3]
18 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/3]
19 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/4]
20 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/4]
21 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/4]
22 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/4]
23 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/5]
24 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/5]
25 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/5]
26 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/5]
27 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/6]
28 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/6]
29 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/6]
30 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/6]
31 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/7]
32 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/7]
33 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/7]
34 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/7]
35 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/8]
36 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/8]
37 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/8]
38 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/8]
39 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/9]
40 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/9]
41 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/9]
42 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/9]
43 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/10]
44 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/10]
45 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/10]
46 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/10]
47 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/11]
48 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/11]
49 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/11]
50 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [watchdog/11]
51 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/12]
52 rt/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [migration/12]
53 be/4 root 0.00 B/s 0.00 B/s 0.00 % 0.00 % [ksoftirqd/12]
vmstat 5 5
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 0 262437312 25728 147808 0 0 3 0 4 5 0 0 100 0 0
0 0 0 262437296 25728 147808 0 0 0 0 58 101 0 0 100 0 0
1 0 0 262437312 25728 147808 0 0 0 0 64 117 0 0 100 0 0
2 0 0 262437312 25728 147808 0 0 0 0 48 95 0 0 100 0 0
1 0 0 262437200 25728 147808 0 0 0 0 58 117 0 0 100 0 0
Não tenho espaço suficiente para copiar / colar a saída de 'ps axf', mas: - não há processos no estado D (sleep de disco - ininterrupto) - todos os processos estão no estado S, exceto a ferramenta de monitoramento executada (como top ou iotop)
Agradecemos antecipadamente por sua ajuda!
Esse bug é documentado no link e até agora a solução é desabilitar o acpi_pad
Nos meus sistemas (IBM Flex x240) isto acontece depois de desabilitar o Hyperthreading.
Sem ter mais detalhes sobre o seu servidor, estou apenas adicionando algo que encontrei em um punhado de servidores com o Xeon procs. Existe um bug da ACPI conhecido que foi "consertado" mas não totalmente corrigido e que afeta os servidores do CentOS 6 e algum hardware.
Você pode tentar adicionar o seguinte aos comandos de inicialização do kernel para ver se isso ajuda (requer reinicialização):
grubby --update-kernel=ALL --args="acpi_pad.disable=1"
Se isso não ajudar, não se esqueça de removê-lo:
grubby --update-kernel=ALL --remove-args="acpi_pad.disable"
Eu suponho que você também tenha procurado pelo dmesg para quaisquer dispositivos que não puderam ser inicializados. Alguns dispositivos devem estar na lista negra do /etc/modprobe.d/blacklist.conf através do RPM "hwdata".
Você também pode querer ativar a visualização de tópicos em "top". Existem ferramentas adicionais que ajudam a depurar threads do kernel que estão aguardando, mas esse é um tópico muito maior.
Tags centos load-average