Eu acho que você alcançou o máximo do que você provavelmente conseguirá com aqueles Xeons antigos, embora ao contrário do ewwhite, eu não acredito que o hyperthreading esteja lhe causando qualquer tipo de problema. De fato, pelo menos desde o ESXi 5.0, a VMware recomendou o uso de hyperthreading para a maioria das cargas de trabalho, e seu próprio teste parece para confirmar que você está se beneficiando do HT. Como ewwhite observa corretamente, no entanto, o uso do HT fará com que algumas métricas no vSphere sejam exibidas de maneira estranha.
Acho que você tem um problema óbvio e, possivelmente, um problema não óbvio aqui:
Primeiro é a questão óbvia que a própria virtualização gera sobrecarga que você nunca pode eliminar completamente. No caso da CPU, certas instruções devem ser virtualizadas para que o hipervisor isole corretamente uma máquina virtual de outra. Assim, em vez de executar a instrução diretamente, como no bare metal, o hipervisor interceptará a chamada e executará várias instruções em seu lugar. A partir da experiência anterior, podemos ver que 87-90% é sobre o que você deve esperar da CPU . Ficando muito passado que exigiria um avanço significativo no hardware. Se agora você está vendo 91% do desempenho da CPU nativa, provavelmente é tão bom quanto o esperado.A segunda é a questão não óbvia da NUMA. Esse é um problema com sistemas multiprocessadores, em que parte da memória é mais rápida quando acessada pela CPU mais próxima e mais lenta quando acessada por outras CPUs. Dependendo de como seu trabalho de renderização manipula a memória, você pode ver algum benefício executando dois renderizadores paralelos em duas VMs, cada uma das quais está presa a uma CPU específica e sempre acessa o memória ligeiramente mais rápida. (Se você executar duas VMs em um único host, cada uma usando metade das vCPUs disponíveis, ESXi deverá classificar isso automaticamente para você.) Embora, se você não estiver vendo esse problema no bare metal, provavelmente obterá pouco benefício tentando isso.