Este é apenas um comentário que é muito longo para comentários.
A resposta curta para sua pergunta é:
Sim. A superutilização de recursos pode matar todas as funcionalidades que o servidor possui. Todo processo requer memória. Quando a memória acaba, tristes vezes.
Resposta longa
Se você não puder recuperar a máquina enquanto ela estiver em dificuldades, encontrar a causa raiz será mais difícil para você.
Na próxima vez que a máquina for desligada, tente salvá-la. imediatamente pare de fazer o que você já sabe que está fazendo. Não desperdice seus preciosos segundos tentando executar um comando de diagnóstico. Apenas pare de fazer o que você sabe que está fazendo primeiro. É um servidor web, mate imediatamente todos os processos apache / nginx / lighttpd. Se ele executar o email, mate imediatamente todos os processos de email. Se for um servidor de banco de dados, NÃO elimine completamente os processos de banco de dados, mas forneça imediatamente o comando de parada (se todas as solicitações de banco de dados vierem por meio de sites ou algum aplicativo, apenas elimine o servidor da Web ou serviço que serve ao aplicativo). >
Você precisa desligar o que estiver alimentando cada vez mais processos para o servidor, para impedir que o servidor tente responder cegamente a todas as solicitações e morra por falta de memória.
Uma vez que está um pouco sob controle, e supondo que você não possa encontrar nada com o diagnóstico, sua única esperança é os logs. Se for um servidor web / email / db, verifique seus logs em busca de itens como o número de IPs que fazem solicitações em um determinado período de tempo, compare os horários em que o servidor falha nas vezes em que ele é executado sem problemas. Verifique o tipo de solicitações da Web ou de e-mail que vieram antes e durante o problema de recursos. Verifique o número de consultas de banco de dados gravadas em seu disco, problemas de E / S de disco podem facilmente fazer o backup de coisas até o ponto de eliminar seu servidor. É provável que você encontre problemas com consultas de banco de dados de longa execução / disco e / ou usuários de email / web abusivos dessa maneira.
Além disso, quando os serviços estão desativados e você está procurando por dicas, verifique a lista de processos para quaisquer processos existentes que estejam sendo executados como usuários do sistema e que não deveriam estar. Por exemplo, você encerra o apache e ele é executado como 'nobody', veja se algum outro script está sendo executado por 'nobody'. Às vezes você pode encontrar shells maliciosos e coisas carregadas para o tmp dessa maneira.
Use o topo para encontrar qualquer coisa que esteja comendo muita memória e, se você não tiver certeza desse processo, investigue-o. Use comandos como o lsof e outras ferramentas do sistema para ver de que diretório esse processo está sendo executado, qualquer coisa que possa lhe dar uma pista sobre um processo ilegítimo.
É possível que você encontre algo assim. Se você não puder, porque o logging é uma droga, então ao menos ligue / ative o log e você terá mais dados se isso acontecer novamente. Se for um servidor de arquivos (ftp, scp, etc), ative o registro para que você possa ver quando os arquivos estão sendo carregados / baixados. As pessoas da sua rede estão fazendo uploads / downloads em massa ao mesmo tempo?
Estas são apenas a ponta do ice berg, há muito que você pode fazer, mas tratá-lo como uma investigação, você precisa de uma pista para trabalhar.