64 bit deve computar mais por ciclo por causa dos registros mais largos e você tem mais registros para jogar. Eu executei vários benchmarks vinculados (por exemplo, lmbench) e comparei 32 bit vs 64 bit em termos de taxa de transferência e throughput por watt e 64 bits em muitos cenários.
Arquitetonicamente, 64 bits apenas permitem que o compilador mantenha mais dados nos registradores, uma vez que 64 bits tem mais e são mais amplos. Mais registros provavelmente permitem melhor reordenamento e pipelining da instrução interna da CPU e, portanto, mais throughput.A desvantagem é que o endereçamento é maior, significando executáveis maiores, portanto, você pode ver um pequeno impacto nos erros de cache de instruções extras. Mas realmente, vá para 64 bits é o meu conselho.
Para referência, aqui estão alguns benchmarks que fiz em um X220 um tempo atrás comparando puro 32 bit, espaço de usuário de 32 bits + kernel de 64 bits, espaço de usuário de 64 bits + kernel de 64 bits e x32. link