Tim, provavelmente é hora de adicionar alguns instrumentos à sua máquina. Sugiro no mínimo algo como sysstat
para registrar instantâneos da atividade do sistema a cada 5 minutos. Quando você reiniciar a máquina, você pode pelo menos olhar o que estava acontecendo nos 5 minutos antes do problema com o utilitário de linha de comando 'sar'.
Você também tentou ver o console da instância? O ec2-get-console-output i-xxxxxxxx pode mostrar alguns problemas no kernel se isso acontecer.
Além disso, como você está no ec2, você deve ter o cloudwatch disponível, ele mostra picos em qualquer estatística quando há falhas?