Como os números médios carregados de 'htop' podem exceder 100% da utilização da CPU? [duplicado]

1

Eu uso 'htop' para monitorar meu servidor web. Recentemente, ele está bastante carregado e a média de carga está mostrando algo assim:

Load average: 3.10 2.56 1.63

Eu procurei na web sobre esses números e encontrei um artigo sobre isso: link

No artigo, diz que se eu tiver 2 CPUs, 2.0 significa 100% de utilização da CPU.

E meu VPS tem duas CPUs, então o que significa 3,1? Como poderia exceder 100% de utilização da CPU?

E a partir desses números, isso significa que eu deveria ser cauteloso sobre o carregamento agora? Mas o desempenho parece totalmente bom, e este é um VPS gerenciado, a empresa de hospedagem não me avisou sobre isso.

Durante o período do dia, a média de carga sempre mostra esses números altos ... aqui está outro instantâneo durante a gravação.

Load average: 3.03 2.77 1.97

Load average: 0.41 1.29 1.60 <---- 5 more minutes later

Então, estou querendo saber quanto espaço sobrou para este site crescer nas configurações atuais? Que tipo de ações proativas devo tomar antecipadamente?

Eu não quero esperar até o servidor irromper.

Obrigado.

    
por Joe Huang 04.11.2013 / 07:31

2 respostas

6

3.1 significa que, em média, existem 3.1 processos usando a CPU, esperando por ela ou aguardando a conclusão da E / S. Não é uma medida de utilização da CPU, mas de carga.

A média de carga é apenas uma informação. Não te diz muito por si só. Peça a um administrador competente do servidor que analise o comportamento do servidor para avaliar o quão bem ele está lidando com a carga que está sendo fornecida.

    
por 04.11.2013 / 07:36
4

A melhor ação proativa que você pode tomar é instalar uma ferramenta de monitoramento / gráfico como Cacti, Zabbix, Nagios, Munin ou Observium. (Existem outras opções disponíveis.)

Rastrear média de carga, utilização da CPU, estatísticas de E / S, uso de memória, solicitações de HTTP por segundo e qualquer outra coisa que você possa imaginar. Com os gráficos, você poderá prever e impedir o tempo de inatividade antes que aconteça.

A maioria das ferramentas também fornece alertas sobre limites, como "Menos de 5% de espaço em disco restante", o que permite que você informe rapidamente sobre a origem do tempo de inatividade.

Essas ferramentas serão menos eficazes se você tiver apenas uma caixa.

    
por 04.11.2013 / 08:51