Uh, " duas vezes mais rápido, se não mais, dependendo do hardware em que é executado " ?? Ah, se ao menos o mundo funcionasse dessa maneira.
Por exemplo, dê uma olhada neste artigo: Ubuntu 12.04 LTS: 32 bits versus desempenho de 64 bits .
Embora alguns dos benchmarks sintéticos mostrem drásticos ganhos de desempenho, também há muitos que mostram apenas ganhos menores (10% a 30%), nenhum ganho ou mesmo uma queda no desempenho. E esses são apenas benchmarks sintéticos que geralmente não fornecem informações úteis sobre o desempenho do sistema ao fazer algo diferente de executar benchmarks.
O desempenho do sistema é muito influenciado por gargalos de "sistema" e você não pode fazer generalizações abrangentes, como o dobro de bits implica o dobro do desempenho.
Dito isso, ainda tento usar os sistemas operacionais de 64 bits porque espero que o desempenho seja pelo menos um pouco melhor. Enquanto o tamanho dos registradores da CPU é dobrado, o mais possível é que o número de registradores aumente de oito em x86 para dezesseis no modo x86_64 de 64 bits. Isso permite que um compilador produza potencialmente um código mais rápido. Existem alguns desses ajustes de instruções que, embora provavelmente insignificantes em qualquer instância, podem ser adicionados quando usados em todo o sistema para um ganho de desempenho útil.
Há também pouca ou nenhuma perda de desempenho para programas compilados para x86 de 32 bits, já que eles podem ser executados no "modo de compatibilidade".
As pessoas geralmente fazem a generalização de que, se você tiver apenas 4 GB ou menos de memória, não haverá diferença entre 32 bits e 64 bits e, portanto, não há razão para usar a versão de 64 bits. Isto simplesmente não é verdade. A arquitetura de instruções da CPU é suficientemente diferente (IMO) no modo de 64 bits para preferir usar o sistema operacional de 64 bits se o seu hardware for compatível.
Afinal, você não gostaria de rodar sua CPU de 32 bits no modo de 16 bits, pois não? : -)