Você pode estar se deparando com uma combinação do recurso de estouro da classe f1-micro instance (que pode enviar a utilização da CPU da instância acima de 100%) e como o autoescalador manipula alta carga de CPU .
During periods of heavy CPU utilization, if utilization reaches close to 100%, the autoscaler estimates that the group may already be heavily overloaded. In these cases, the autoscaler increases the number of virtual machines by at least an extra 50% or a minimum of 4 instances, whichever is higher. In general, CPU utilization within a managed instance group will not exceed 100%.
Acho que você descreveu suas opções muito bem. Eu recomendaria verificar se você pode gerenciar sem escalonamento automático.
Se a distribuição de carga do seu aplicativo se correlacionar com o ritmo diurno (sem tráfego durante a noite, carga alta durante o dia), ajuste o tamanho do grupo de instâncias semiautomático (pense em chamar a API do GCE / gcloud do cron).