Como Safado diz, você ficou sem memória, resultando em chutes e fechando as coisas. Eu também tive esse problema .
Eu tomei as seguintes ações:
- Maior quantidade de troca disponível, então o oom-killer não seria chamado tão rapidamente
- Configurar monit para me alertar quando a memória começar a ficar
- Configure munin para verificar o uso de memória e ver tendências
Isso me permitiu acessar o servidor quando as coisas estavam começando a parecer instáveis e verificar o que estava usando toda a memória.
No meu caso, era o Apache. Eu o reconfigurei para reduzir o número de threads e servidores de reposição, e os problemas desapareceram.
O ponto principal é quando algo assim acontece com você, o monitoramento realmente ajudará.