Em vez do AutoScaling baseado em CPU , tente Carregar o servidor .
O AWS AutoScaling pode operar em qualquer métrica do CloudWatch e você pode escrever suas próprias métricas personalizadas do CloudWatch.
Mais informações sobre como o AutoScaling funciona: link
Criando uma métrica personalizada
CloudWatch metrics are scoped within namespaces, and can be further qualified by up to 10 dimensions. For example, latency could be tracked for a pair of applications ("App1" and "App2") while keeping the values isolated from each other:
$ mon-put-data -namespace App1 -metric-name Latency -value 104
$ mon-put-data -namespace App2 -metric-name Latency -value 120