A primeira coisa que você deve fazer é configurar alguns monitoramentos para informar quando o servidor não responder. Você pode fazer isso usando pingdom e / ou cloudwatch para verificar o tempo de atividade do serviço e as estatísticas do sistema, como cpu e ram. Ambos têm planos gratuitos para contas pequenas. Isso permitirá que você tenha uma idéia quando ela ficar inativa e facilite a busca dos logs em relação ao que estava acontecendo naquele momento. Usully algo como isto pode ser causado pelo sistema não ter recursos suficientes, você não menciona qual é o tamanho da sua instância, mas algo como um micro poderia ser apenas pegging 100% cpu por um simples trabalho cron e em que servidor ponto apenas trava .
Aloso verifica outros logs ao lado do syslog, verifica todos os logs do aplicativo para ver se algum deles está gerando um erro antes que o sistema fique inativo.