Eu tive alguma perspectiva sobre isso nos últimos meses & Acredito que esses itens para assistir abordarão todas as preocupações acima:
1) O comentário do @Ross na postagem original é a chave. As instâncias T2, não importa a escala e não importa se são EC2 ou RDS, deixarão de funcionar quando seus créditos de CPU acabarem à medida que as demandas de CPU de pico continuarem.
2) O modo de falha de um servidor da web CMS que vimos com mais frequência é mostrado exatamente por essa condição: o gráfico do CloudWatch mergulha na direção zero quando a porcentagem da CPU necessária por httpd
processa excede a porcentagem da CPU atribuída a esse tipo de instância (veja o link do doc abaixo).
3) A solução rápida para uma instância T2 que esgotou os créditos da CPU é desligar, atualizar o tipo de instância e iniciar a instância novamente, o que leva cerca de 3-4 minutos. A descrição mais importante das capacidades de diferentes tipos de instâncias está aqui: link
4) Qualquer servidor da Web de produção na AWS deve ter um endereço Elastic IP atribuído antecipadamente por esse motivo: se não, e a instância for redimensionada, o endereço IP será alterado, deixando o servidor da Web inacessível muito além do que seria 3-4 minutos de inatividade.
5) A única maneira de adquirir mais créditos de CPU é atualizar o tipo de máquina. A quantidade de créditos que cada tamanho de instância T2 pode conter é descrita no link doc acima: é sempre igual ao trabalho da CPU que o tipo de instância faria em 24 horas.
6) A máquina pode retornar à sua escala original durante um pouco de tempo de inatividade programado (novamente, 3-4 minutos) depois que o desempenho de pico exigir a redução.
7) A atividade de E / S não causou qualquer degradação no desempenho do nosso servidor da Web em nenhum período de pico até o momento. A quantidade de IOPS é determinada estritamente pelo tamanho do volume do EBS. O significado exato de IOPS e esse relacionamento são descritos aqui: link
8) Nenhuma das métricas do Cloud Watch Freeable Memory nem Conexões com o DB foram de alguma forma antecipando ou corrigindo problemas de desempenho em um ambiente intensivo de servidor da Web.