Normalmente escalonamento automático cria dinamicamente ou exclui VMs para atender a meta do grupo, não conforme a instância individual. Essas metas são baseadas na utilização geral do grupo.
If you scale based on CPU utilization, you can set your target utilization level at 75% and the autoscaler will maintain the CPU utilization of the specified group of instances at or close to 75%.
Por exemplo
gcloud compute instance-groups managed set-autoscaling example-managed-instance-group
--max-num-replicas 20 --target-cpu-utilization 0.75 --cool-down-period 90
Teste: Durante períodos de alta utilização da CPU, se a utilização atingir quase 100%, o autoescalador estima que o Grupo já esteja sobrecarregado. Nesses casos, o autoescalador aumenta o número de instâncias em pelo menos 50% ou no mínimo 4 instâncias, o que for maior. Não há nenhuma opção atualmente disponível para especificar o intervalo de tempo para o monitoramento sequencial da utilização total antes de aumentar ou diminuir a escala.
Você pode denunciar isso como uma solicitação de recurso com Rastreadores de problemas.