Se você estiver executando uma única instância de seu webapp, não há nada para realmente balancear a carga. Assim, você apenas configuraria o dimensionamento no portal com base em uma métrica específica. Por exemplo, se CPU% > 80% para X minutos, em seguida, dimensione para instâncias X. Em seguida, defina outra regra que indica quando a CPU < 80% para X minutos, em seguida, reduza para instâncias X.
Se você configurasse duas instâncias e fizesse o balanceamento de carga, teria que adicionar um saldo de carga às instâncias. Isso é simples de fazer. Então, a partir daí, você também pode definir as mesmas regras de monitoramento.