Soa muito como se você estivesse ficando sem memória. fork () basicamente falhará apenas por causa dos limites de ulimit (número de descritores de processo ou arquivo) ou falta de memória. Então, se você não está acertando seus ulimits, isso significa que você está sem memória.
Oroot geralmente é excede os limites, como no máximo # de processos, mas verifique seu limits.conf para ter certeza. Dependendo da configuração do EC2, você pode não conseguir fazer login diretamente como root, então, nesse caso, você provavelmente terá que manter um shell de root aberto na caixa ...
Um sistema com problemas pode não conseguir fazer o log no disco, então a única maneira de saber o que está acontecendo provavelmente é através do "dmesg" (que imprime o buffer de anel do kernel). Tente manter um shell de root aberto na caixa com a seguinte execução:
while true ; do dmesg -c ; sleep 0.1 ; done
Além disso, manter um vmstat 1
em exibição pode revelar algo interessante, como, por exemplo, troca pesada ...
Você usou seu syslog para "oom-killer"?