Você pode padronizar um nó obtendo um número fixo de jogos de tamanhos diferentes e clonar esse nó várias vezes. No entanto, isso só funciona se os seus padrões de uso forem relativamente constantes.
Existe software de cluster com posicionamento baseado na utilização. Para programas de aplicativos não isolados, para instâncias de contêiner ou para VMs completas. Você não mencionou contêineres nem nada, então presumo que eles não estejam em uso. Você também não mencionou a plataforma do sistema operacional, portanto, assuma o Linux.
Considere, por exemplo, clusters de marcapasso como no RHEL HA. Recursos em tal cluster podem ter utilização de recursos definida . Portanto, seus servidores grandes e pequenos têm requisitos de CPU e memória diferentes e são posicionados adequadamente. Como bônus, você pode se recuperar da falha do nó e migrar recursos para outro nó. No slide menos, os clusters de HA são difíceis de criar e precisam de testes para garantir que eles façam a coisa certa.
Se você tivesse um contêiner para implantar, o Kubernetes poderia gerenciá-lo em um cluster. Mais uma vez, um pouco de complexidade para obter esses recursos.
Você poderia reconsiderar a abordagem de nó bare-metal e fornecer a cada servidor sua própria VM. O hipervisor pode ser executado por você ou por algum provedor de nuvem. Em ambos os casos, encontre as contagens de vCPU e vRAM ideais para os diferentes tamanhos. O posicionamento nos nós é feito para você na nuvem, com um produto como o VMware DRS ou manual.