As instâncias de T2 devem ser absolutamente evitadas em cenários em que seus aplicativos consomem consistentemente seus créditos, precisamente devido a esse tipo de problema com o sistema de créditos da CPU fornecido pela AWS. Se o seu aplicativo é intensivo de CPU de forma consistente, é melhor ir para as instâncias C3 / C4, que têm as mesmas proporções CPU / Memória (exceto t2.large, que é equivalente a M4.large).
O escalonamento automático funciona porque você supõe que a capacidade do seu cluster é consistente e proporcional ao número de instâncias, o que pode não ser verdade ao usar instâncias do T2 em alguns cenários. Uma vez que algumas de suas instâncias ASG (não necessariamente todas elas, devido a diferentes datas de lançamento, eventos de escalonamento automático, etc.) morram seus créditos, todas as métricas enviadas para a Cloudwatch estão degradando a consistência das métricas ASG, tornando-as inúteis tomar boas decisões para o escalonamento automático.