Eu tenho uma instância do Amazon EC2 (c1.medium, ami-ed46a784) que apresenta curtos picos na média de carga a cada 32 horas. A carga média é normalmente em torno de 0,15, mas aumenta para 3+ por cerca de 15 minutos durante esses picos. Durante esse período, não há aumento no uso da CPU, no tráfego em disco, no uso da troca, nas interrupções de IRQ, no tráfego do apache ou em qualquer outra métrica relatada pela instalação do collectd. Desativar todos os trabalhos do cron que eu adicionei à instalação base não teve efeito. Essa instância executa o chef , o apache, o mysql, o couchdb, o memcached e um serviço python distorcido - todos os quais recebem atualmente muito pouco tráfego.
Abaixo estão alguns dados coletados durante um desses picos:
/usr/bin/top output:
top - 14:31:00 up 65 days, 20:48, 1 user, load average: 3.00, 2.13, 1.01
Tasks: 125 total, 1 running, 124 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.8%us, 0.5%sy, 0.0%ni, 98.0%id, 0.2%wa, 0.0%hi, 0.1%si, 0.4%st
Mem: 1788724k total, 1723448k used, 65276k free, 179284k buffers
Swap: 917496k total, 124k used, 917372k free, 680404k cached
...process with the most CPU usage has just 4%...
/usr/bin/iostat output:
Linux 2.6.21.7-2.fc8xen (foo.example.com) 11/08/09 _i686_ (2 CPU)
avg-cpu: %user %nice %system %iowait %steal %idle
0.78 0.00 0.80 0.19 0.42 97.95
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sda2 0.00 0.00 0.01 8762 74472
sda3 0.00 0.00 0.00 944 288
sda1 19.29 0.24 242.63 1354218 1380794096
sdb 0.34 0.07 6.50 393928 36997032
/usr/bin/mpstat output:
Linux 2.6.21.7-2.fc8xen (foo.example.com) 11/08/09 _i686_ (2 CPU)
14:31:00 CPU %usr %nice %sys %iowait %irq %soft %steal %guest %idle
14:31:00 all 0.78 0.00 0.51 0.19 0.00 0.14 0.42 0.00 97.95
/usr/bin/free -m output:
total used free shared buffers cached
Mem: 1746 1683 63 0 175 664
Épossívelqueainstânciadeoutrapessoanomesmohostfísicopossacausaressespicos?Existealgumoutrodadoqueeudeveriatentarcoletarduranteumpicoqueajudariaadiagnosticaroproblema?Oquemaispodecontribuirparacarregaramédia?
Esseproblemaé também publicado no fórum da AWS.
Atualização # 1
Também coletei dados usando dstat e publiquei aqui . Não mostra nada causando carga, tanto quanto eu posso dizer.