A CPU do servidor aumenta repentinamente e se torna inutilizável - Dicas para monitorar / analisar isso?

1

meu servidor está em queda nas últimas 24-48 horas, a CPU aumenta de 15% para 100% e o servidor se torna inutilizável e todos os meus sites diminuem como conseqüência disso.

Alguma dica de como eu poderia acompanhar o que está acontecendo no meu servidor?

Alguma sugestão de software que possa me ajudar a impedir que a CPU seja maximizada indefinidamente, e talvez forçar uma reinicialização automática da caixa?

Seria muito útil ter um indicador do que fazer e seria muito apreciado. :)

    
por RadiantHex 06.05.2011 / 09:36

4 respostas

2

você deve tentar investigar qual era o problema. verifique se há / var / log / messages antes de reinicializá-lo e outros logs por hora.

do que você pode tentar configurar algo como virtualbox para fins de teste e executar seus servidores principais nele. Isso diminuirá a produtividade, mas adicionará alguma estabilidade e você poderá acessá-la.

verifique também se há atualizações automáticas. eles poderiam comer o seu CPU.

    
por 06.05.2011 / 09:40
2

Instale o Munin. Também não tenha medo de farejar o tráfego

    
por 06.05.2011 / 09:48
2

Para monitorar você pode tentar usar o monit - ele deve ser capaz de reiniciar um servidor em fuga, se você o colocar sob seu controle.

Como uma solução rápida e suja, você pode colocar algo como

date >> /var/log/cpu_hogs && ps -eo pcpu,pid,user,args | sort -r -k1 | head -5 >> /var/log/cpu_hogs

no cron para ser executado a cada 5 minutos ou mais e depois de uma falha, dê uma olhada no que estava comendo suas CPUs pouco antes de o servidor travar.

    
por 06.05.2011 / 09:58
1

Você deve ativar Contabilidade do Processo do Linux se quiser uma visão histórica mais detalhada do que estava usando a CPU e outros recursos no nível do processo e no nível do usuário que / var / log / messages et al. normalmente fornece.

Quanto às reinicializações automáticas quando o servidor não responde, o que você vai querer olhar é chamado watchdog (man page do ubuntu).

    
por 06.05.2011 / 09:45