A resposta curta é que, atualmente, o ambiente flexível usa o autoescalador do Compute Engine, que tem o comportamento a seguir :
During periods of heavy CPU utilization, if utilization reaches close to 100%, the autoscaler estimates that the group may already be heavily overloaded. In these cases, the autoscaler increases the number of virtual machines by at least an extra 50% or a minimum of 4 instances, whichever is higher. In general, CPU utilization within a managed instance group will not exceed 100%.
Uma maneira de reduzir a agressividade do autoescalador é definir target_utilization
como um valor alto. Esperamos que, futuramente, mais parâmetros para ajustar o autoescalador sejam adicionados, o que está mais de acordo com o ambiente padrão opções .