VPS congelar a cada alguns dias

1

Eu tenho um problema recorrente com um dos meus aplicativos / servidores pelos quais sou responsável. Eu basicamente tinha um VPS com toda a pilha necessária para executar meu aplicativo (nginx + postgresql + ruby + ruby on rails + passageiro) mantido por ansible. Houve um problema com o servidor que foi congelado uma vez por dois dias. Ele não estava recebendo nenhuma conexão de entrada na porta 80 nem 22 (portanto, eu nem consegui me conectar a ele usando o ssh). A única solução foi reiniciá-lo. Ignorei esse problema porque tinha certeza de que havia algo errado com a máquina diretamente e mudar para a nova corrigirá o problema.

Eu mudei recentemente meus ansiosos playbooks um pouco e meu aplicativo foi dividido em 3 servidores separados. Eu tinha certeza que o problema não aconteceria, mas, infelizmente, está lá de novo e, o que é pior, ele atinge todas as três máquinas! Eu estou usando o mesmo papel ansible para configuração básica do servidor de todos esses três servidores, mas não há nada que possa ser perigoso. Apenas coisas básicas como criação de usuário, geração de chaves SSH etc. De qualquer forma, há mais - agora, para esses novos três servidores, mesmo a reinicialização não pode corrigir esse problema, depois de reiniciar o Azure Panel, ainda não consigo me conectar qualquer uma dessas três máquinas em 80 nem 22 portas.

Obviamente, não consigo depurar logs desses novos servidores porque eles estão inacessíveis, mas ainda tenho o antigo em execução, por isso talvez seja útil verificar o que está causando esses congelamentos nele? Eu simplesmente não consigo encontrar nada nos logs (ou não sei o que e onde devo procurar por alguma pista).

Servidores usam o Ubuntu 14.04

    
por mbajur 11.11.2015 / 22:58

1 resposta

0

Muitas coisas podem estar dando errado. Aqui está o que eu faria:

  • Continue conectado e execute tail -f <every log file that might be helpful> . Você pelo menos verá as últimas coisas que aconteceram quando morreu.

  • Veja os logs após a reinicialização. Veja também dmesg . Você terá que rolar waaaaay de volta para ver o último evento antes da reinicialização.

  • Veja os registros do console. A AWS entrega isso no Console do EC2 (e via API), não sei o que o Azure faz com eles.

por 12.11.2015 / 02:27