O que poderia estar causando picos de carga nesta instância do EC2?

3

Eu tenho uma instância do Amazon EC2 (c1.medium, ami-ed46a784) que apresenta curtos picos na média de carga a cada 32 horas. A carga média é normalmente em torno de 0,15, mas aumenta para 3+ por cerca de 15 minutos durante esses picos. Durante esse período, não há aumento no uso da CPU, no tráfego em disco, no uso da troca, nas interrupções de IRQ, no tráfego do apache ou em qualquer outra métrica relatada pela instalação do collectd. Desativar todos os trabalhos do cron que eu adicionei à instalação base não teve efeito. Essa instância executa o chef , o apache, o mysql, o couchdb, o memcached e um serviço python distorcido - todos os quais recebem atualmente muito pouco tráfego.

Abaixo estão alguns dados coletados durante um desses picos:

/usr/bin/top output: 
top - 14:31:00 up 65 days, 20:48, 1 user, load average: 3.00, 2.13, 1.01 
Tasks: 125 total, 1 running, 124 sleeping, 0 stopped, 0 zombie 
Cpu(s): 0.8%us, 0.5%sy, 0.0%ni, 98.0%id, 0.2%wa, 0.0%hi, 0.1%si, 0.4%st 
Mem: 1788724k total, 1723448k used, 65276k free, 179284k buffers 
Swap: 917496k total, 124k used, 917372k free, 680404k cached 
...process with the most CPU usage has just 4%... 
/usr/bin/iostat output: 
Linux 2.6.21.7-2.fc8xen (foo.example.com) 11/08/09 _i686_ (2 CPU) 
avg-cpu:  %user   %nice %system %iowait  %steal   %idle
          0.78    0.00    0.80    0.19    0.42   97.95

Device:            tps   Blk_read/s   Blk_wrtn/s   Blk_read   Blk_wrtn
sda2              0.00         0.00         0.01       8762      74472
sda3              0.00         0.00         0.00        944        288
sda1             19.29         0.24       242.63    1354218 1380794096
sdb               0.34         0.07         6.50     393928   36997032
/usr/bin/mpstat output: 
Linux 2.6.21.7-2.fc8xen (foo.example.com) 11/08/09 _i686_ (2 CPU) 
14:31:00 CPU %usr %nice %sys %iowait %irq %soft %steal %guest %idle 
14:31:00 all 0.78 0.00  0.51 0.19    0.00 0.14  0.42   0.00   97.95 
/usr/bin/free -m output: 
     total used free shared buffers cached 
Mem: 1746  1683 63   0      175     664 

Épossívelqueainstânciadeoutrapessoanomesmohostfísicopossacausaressespicos?Existealgumoutrodadoqueeudeveriatentarcoletarduranteumpicoqueajudariaadiagnosticaroproblema?Oquemaispodecontribuirparacarregaramédia?

Esseproblemaé também publicado no fórum da AWS.

Atualização # 1

Também coletei dados usando dstat e publiquei aqui . Não mostra nada causando carga, tanto quanto eu posso dizer.

    
por Garret Heaton 10.11.2009 / 07:22

1 resposta

1

Eu verificaria os cronjobs em execução no seu host. Na verdade, se você tem um virt e no mesmo host físico existe outra virt usando, por exemplo, a largura de banda das unidades sata e você quer gravar ao mesmo tempo no disco, pode causar uma carga maior do que seria normal em um único ambiente não virtualizado e não compartilhado. É verdade para qualquer operação de IO. Btw. você se importaria de pressionar 1 quando estiver no topo apenas para ver todos os núcleos. Parece que não há carga real em seu host, pelo menos, não há IOwait ou qualquer tipo de razão pela qual podemos ver essa carga 3.00. Estou curioso para saber o que você pode ver em ambos os núcleos que você tem. Além disso, se você pode instalar o dstat e executá-lo para verificar o que está acontecendo.

    
por 10.11.2009 / 12:45