Certamente, é mais do que possível pausar / despausar ou até mesmo desativar / em VMs com base na carga, mas o problema que você terá ao fazer isso com base em uma solicitação da Web é que a solicitação quase certamente expirará antes que o servidor seja ligado novamente. Se você fez isso por meio da pausa, você pode se safar, mas obviamente a VM permanecerá em uma forma de memória mesmo quando estiver pausada, economizando apenas CPU - o que, se não for tarefa, seria muito baixo, negando a necessidade de pausar isso.
Para referência, eu uso o vSphere da VMWare para acionar mais unidades de diferentes tipos de VMs baseadas na carga, mas isso é carregado em centenas de milhares de usuários simultâneos, para que eu possa lidar com a falta de granularidade.
Ah, e uma das maneiras de você fazer isso é definir os balanceadores de carga para relatar carga alta e baixa a uma ou mais VMs de controle que, em seguida, assumem o trabalho de aumentar e diminuir a contagem de VMs.