Conseguimos rastrear o problema. Estávamos inicializando de uma AMI que foi criada com uma instância menor (que tinha apenas um soquete de processador). O problema era que havia um parâmetro de inicialização numa=off
em /boot/grub/grub.conf. Uma vez que este parâmetro foi removido e a instância foi reinicializada, conseguimos utilizar todos os 32 CPs (todos os hyperthreads).