Recentemente, mudei para o The Cloud a partir de um servidor bare-metal para uso pessoal e não poderia estar mais feliz. Exceto por uma coisa: Meu servidor trava uma vez por semana .
A Rackspace tem sido ótima e extremamente útil e eu gostaria de ficar com eles e recomendá-los a outras pessoas. Mas com esse problema me disseram que o servidor está ficando sem memória e preciso analisá-lo. Enquanto eu estou bem com isso e isso parece ser o meu problema, eu nunca ouvi falar de uma máquina Linux falhando de ficar sem memória. Na minha experiência, seria, na pior das hipóteses, executado muito lentamente ou o kernel iria começar a matar processos.
Alguns detalhes:
- Executando o Gentoo Linux (atualizado)
- 512MB de RAM, 1G de swap
- Serviços instalados & corrida:
- 2 processos do Apache 2 (1 mínimo, para servir recursos e proxies estáticos / armazenados em cache; o segundo tem cgi, mod_perl e mod_jk)
- 2 instâncias do Tomcat (1 tem 2 aplicativos criados, o outro é apenas para o Nexus)
- mysql
- Quando o acidente acontece:
- o servidor pode ser pingado
A conexão de - ssh trava indefinidamente
- o console permitirá o nome de usuário, mas o prompt de senha nunca aparece. depois de 60 segundos, o tempo limite e eu sou apresentado com outro prompt de login. repita.
- serviços (http, tomcat, mysql) não podem ser contatados; A conexão irá travar e não reportará 404, servidor não encontrado, etc.
O - Softboot não funcionará, o hard boot precisa ser executado frequentemente mais de uma vez (mesmo com 30 min de espera entre as tentativas de reinicialização)
Eu executei esta mesma configuração em servidores ao longo dos anos, mas com apenas 256MB de RAM. A única diferença aqui é que estou em uma máquina virtual.
Minha pergunta pode ter uma de duas formas: Alguém já teve um problema semelhante com a nuvem Rackspace ou outros hosts na nuvem? (e, em caso afirmativo, qual foi a solução?) ou; O que é uma boa maneira de rastrear meu problema? Eu configurei um cron que gera uptime
e free
para um arquivo a cada minuto para que eu possa examiná-lo após o próximo acidente, mas isso parece ser hacky. / p>
Divulgação Completa: Sou desenvolvedor de software por profissão, então é onde a maior parte da minha experiência é, mas tenho cerca de 15 anos de experiência usando Linux para desktop e servidores para uso pessoal e profissional.