Desde que o Windows evite os 2 núcleos 'falsos' na máquina com hyperthreaded, então não haverá diferença.
Se o Windows decidir executar ambos os encadeamentos no cpu0 e no cpu1 (o falso), isso será um impacto significativo no desempenho.
Estou com problemas para encontrar referências na web, mas imagino que o sistema operacional Windows seja inteligente o suficiente agora.
O algoritmo será mais rápido na máquina com hyperthread, se você executá-lo com 4 threads