Você pode precisar mudar a arquitetura do seu hardware para se adequar ao problema. Não tenho certeza do tipo de problema que você está tentando resolver com isso. É provável que você acabe com uma VM muito lenta se definir as coisas assim.
Você pode ser melhor servido com um servidor de quatro soquetes com 6 ou 8 núcleos em cada soquete. Isso permitiria que você usasse 20 núcleos distribuídos em 3-4 soquetes, o que seria melhor para o desempenho.
Usar vários núcleos em diferentes soquetes em uma única máquina pode ser difícil de ajustar para o desempenho. Tentar espalhar o trabalho por vários nós de hardware pela rede diminuirá ainda mais a velocidade, já que todos os dados precisam passar pela camada de rede.
A solução tradicional para esse tipo de requisito de computação é usar algo como MPI ou MOSIX. No entanto, é uma solução para um tipo específico de carga de trabalho - onde os dados são bem particionados ou podem ser facilmente distribuídos e onde a sincronização não acontece regularmente.