O que isto significa é que você nunca terá mais de 8 threads executando em paralelo em sua máquina virtual. No entanto, por meio da mágica da alocação de recursos do ESX, você pode dar a esses threads um pouco de potência. Você não está limitado à taxa máxima de suas CPUs reais, os métodos de balanceamento de carga da CPU do ESX permitirão a execução mais rápida do que isso ... contanto que o que você esteja fazendo com ele seja capaz de executar uma execução levemente fora de ordem .
Isso é realizado aproveitando uma estrutura de fila para recursos da CPU. O trabalho é despachado para vários processadores, conforme necessário. Uma única vCPU pode ser executada em qualquer qualquer das CPUs físicas no sistema (ou nas CPUs no nó local, se estiver em um sistema NUMA). A obtenção de desempenho de vCPU além do desempenho da CPU física é feita pelo envio de trabalho de uma única vCPU para várias CPUs físicas em paralelo ou pelo menos muito próximas umas das outras.
Quando chega a hora de remontar o trabalho retornado por várias CPUs para emular uma única vCPU, ela parece à VM como se uma única CPU estivesse funcionando muito rápido. O ESX reagrupa as várias unidades de trabalho na ordem correta.
Nem todas as cargas de trabalho são adequadas para isso, é claro. Trabalhos que submetem muito trabalho iterativo que é vagamente relacionado entre si, se é que é o melhor caso para isso. Trabalhos que envolvem muitas dependências restritas com instruções anteriores, como as chamadas recursivas de algoritmos de criptografia, não serão capazes de escalar quase tão longe.