Alta carga do servidor detectada e servidor automaticamente parado

1

Durante o último mês, meu VPS passou por picos de carga no servidor, e o servidor foi desligado e tenho que reiniciá-lo manualmente.

Isso não acontece todos os dias, mas aconteceu pelo menos uma vez a cada dois ou três dias no último mês. O pico acontece em algum momento da noite, geralmente entre 12 e 3 horas da manhã.

Ontem à noite às 12:28, a carga do servidor foi de 25, 65, 125 (15 min avg, 5 min avg, 1 min avg). É quando o servidor é desligado. Um minuto antes, a carga do servidor era normal (menos de 5 para todas as três médias). A memória e o tráfego de entrada / saída são normais.

Eu não consegui diagnosticar o problema. Tentei armazenar a saída do comando "ps aux" a cada segundo nas últimas 24 horas, mas não encontrei nenhuma irregularidade.

Eu acho que um processo pode estar se desdobrando em um loop ao infinito. Acontece tão rápido que o servidor é desligado sem poder registrar nenhuma irregularidade.

Como posso descobrir o que acontece? Eu não tenho muita experiência com a administração do sistema.

Meu sistema operacional é o Ubuntu 12.10. É um servidor web. Eu tenho o Apache e o MySQL instalados nele.

Obrigado,

    
por Anas 13.07.2014 / 16:54

1 resposta

0

Esta não é uma pergunta específica suficiente, mas posso tentar ajudar de qualquer maneira.

Você viu o que está causando a falha? Nós nos deparamos com o problema em que bots estavam atacando nosso servidor e causando sobrecarga. Isso pode acontecer em coisas como WordPress e Drupal. Às vezes, os ataques do DOS eram suficientes para travar o servidor. Verifique seus logs de acesso e veja se o volume aumenta na época da falha, especialmente nas páginas de login. Há várias coisas que você pode fazer se for esse o caso, como instalar fail2ban, mod_evasive, Cloudflare, limitação de taxa de tabelas IP, etc ...

Você também pode estar ficando sem RAM, e você pode ser capaz de ativar o espaço de troca como estouro. Se você usar swap, certifique-se de descobrir o que está inundando sua RAM, para ter certeza de que não a usará no futuro (a troca é lenta e você deve ajustar seu aplicativo na memória RAM disponível).

Também pode haver uma atualização ruim em seu servidor, isso aconteceu com muitas pessoas no AWS Amazon Linux em fevereiro / março depois que uma atualização ruim foi enviada. A cada 24 horas ou mais, o kernel entrava em pânico. Este pode ser o caso com uma atualização do Ubuntu.

Pode haver um host com falha no seu VPS, mas isso pode não ser o caso, pois algumas empresas alteram seu host quando você reinicia ou se você interrompe / inicia uma instância.

Talvez haja um problema de configuração com o Apache / MySQL, especialmente envolvendo o cache de banco de dados no MySQL ou no Prefork (se configurado dessa forma) no Apache.

Há um zilhão de motivos para o seu servidor falhar, mas talvez uma dessas sugestões possa ajudá-lo.

    
por 14.07.2014 / 05:19

Tags