Eu não sei se há uma ferramenta da Amazon para fazer isso, mas eu acho que você poderia atacar o problema de duas maneiras: A) descobrir o que está causando o bloqueio e corrigi-lo
B) instale o software watchdog e faça com que ele reinicialize o sistema se um processo estiver bloqueado, supondo que seja apenas um processo e não o sistema sendo bloqueado
C) instale / configure cotas de recursos para evitar que os processos do usuário sobrecarreguem os recursos do servidor.
Se houvesse mais informações, talvez outras pessoas tivessem outras sugestões, mas pelo que você postou, eu pensaria que talvez essas sugestões estivessem no caminho certo?