Escalonador automático do GCP: como configurar o escalonador automático para ampliar somente se o uso da CPU ultrapassar 70% por mais de 5 minutos?

1

Eu tenho um grupo de instâncias gerenciadas com um HTTP (S) LB na frente dele. Atualmente, configurei uma política de dimensionamento automático para aumentar ou diminuir a escala com base na utilização da CPU e o limite está definido como 70%. Mas observei que, se houver algum aumento momentâneo no uso da CPU por um breve período, novas instâncias são adicionadas e, imediatamente após alguns minutos, algumas das instâncias existentes são excluídas, já que o uso da CPU teria caído. Eu quero o auto-scaler ignorar quaisquer picos momentâneos dizendo adicionar mais instâncias apenas se o uso da CPU ultrapassar 70% por mais de 5 minutos. Como faço para isso?

Cumprimentos,
Shobhana

    
por Shobhana Sriram 05.10.2018 / 09:47

1 resposta

0

Normalmente escalonamento automático cria dinamicamente ou exclui VMs para atender a meta do grupo, não conforme a instância individual. Essas metas são baseadas na utilização geral do grupo.

If you scale based on CPU utilization, you can set your target utilization level at 75% and the autoscaler will maintain the CPU utilization of the specified group of instances at or close to 75%.

Por exemplo

gcloud compute instance-groups managed set-autoscaling example-managed-instance-group --max-num-replicas 20 --target-cpu-utilization 0.75 --cool-down-period 90

Teste: Durante períodos de alta utilização da CPU, se a utilização atingir quase 100%, o autoescalador estima que o Grupo já esteja sobrecarregado. Nesses casos, o autoescalador aumenta o número de instâncias em pelo menos 50% ou no mínimo 4 instâncias, o que for maior. Não há nenhuma opção atualmente disponível para especificar o intervalo de tempo para o monitoramento sequencial da utilização total antes de aumentar ou diminuir a escala.

Você pode denunciar isso como uma solicitação de recurso com Rastreadores de problemas.

    
por 05.10.2018 / 20:34