Alta carga média devido ao alto carregamento da CPU do sistema (% sys)

5

Temos um servidor com site de alto tráfego. Recentemente nos mudamos de

Servidor central de 2 x 4 (8 núcleos em / proc / cpuinfo), 32 GB de RAM, executando o CentOS 5.x, para

Servidor central de 2 x 4 (16 núcleos em / proc / cpuinfo), 32 GB de RAM, executando o CentOS 6.3

Servidor rodando nginx como proxy, servidor mysql e busca por esfinge.

O tráfego é alto, mas os bancos de dados mysql e sphinx-search são relativamente pequenos, e geralmente tudo funciona muito rápido.

Hoje em dia, a média de carregamento do servidor é de 100 ++. Olhando para cima e sar, notamos que (% sys) é muito alto - 50 a 70%. Utilização de disco foi menos 1%. Nós tentamos reiniciar, mas o problema existia após a reinicialização. A qualquer momento, o servidor tinha pelo menos 3-4 GB de RAM livre.

Apenas a mensagem mostrada pelo dmesg era "possível inundação de SYN na porta 80. Enviando cookies.".

Aqui está o snippet do sar

11:00:01        CPU     %user     %nice   %system   %iowait    %steal     %idle
11:10:01        all     21.60      0.00     66.38      0.03      0.00     11.99

Sabemos que isso é um problema de tráfego, mas não sabemos como proceder no futuro e onde verificar a solução.

Existe uma maneira de encontrar exatamente onde "66,38%" são usados.

Qualquer sugestão seria apreciada.

atualização: Hoje a média de carga é "normal" e "sys%" também está OK ~ 4%. No entanto, o tráfego de hoje é cerca de 20-30% menor do que ontem. Isso me faz pensar que o problema de ontem é por causa de alguma configuração do kernel para o TCP.

    
por Nick 10.11.2012 / 22:11

1 resposta

1

Eu instalaria em cima do repositório EPEL. Em cima deve ajudá-lo a mostrar o diagnóstico do que está causando a atividade do% sys.

O Atop também tem um recurso -r superior que lhe permitirá percorrer os logs para trás e avançar no tempo usando as teclas t / T.

Também dê uma olhada em / proc / interrupts e através de seu / var / log / httpd / logs e classifique-os por ip para ver se há algum IP suspeito causando quantidades anormais de tráfego do httpd.

Eu cron cron cat / proc / interrompe a um arquivo de log. Procure por altos deltas nos interupts.

    
por 05.12.2012 / 01:56