Como outros já disseram, não podemos mais resfriar efetivamente as CPUs se quisermos aumentar a voltagem necessária para os mesmos aumentos de freqüência relativos no passado. Houve um tempo (era P4 e anterior) quando você pode comprar um novo processador e ver um ganho "imediato" como velocidade, porque o clock foi significativamente aumentado em comparação com a geração anterior. Agora chegamos a uma parede térmica, de certa forma.
Cada nova geração moderna de processadores está aumentando um pouco na taxa de clock, mas isso também é relativo à capacidade de resfriá-los apropriadamente. Os fabricantes de chips, como a Intel, estão continuamente se concentrando em diminuir o tamanho do processador para torná-los mais eficientes no consumo de energia e produzir menos calor nos mesmos relógios. Como uma nota lateral, esse tamanho de matriz encolhido faz com que os processadores modernos fiquem mais propensos a morrer por excesso de voltagem do que por superaquecimento. Isso significa que ele também está limitando o clock do teto de qualquer CPU de geração atual sem outras otimizações feitas pelo fabricante do chip.
Outra área que está sendo strongmente focada pelos fabricantes de chips é aumentar o número de núcleos no chip. Isso contribui para aumentos significativos no poder computacional, mas apenas quando se usa software que aproveita vários núcleos. Observe a diferença entre potência computacional e velocidade aqui. Simplificando, velocidade refere-se à rapidez com que um computador pode executar uma única instrução, enquanto a potência computacional refere-se a quantos cálculos um computador pode fazer em um determinado período de tempo. Sistemas operacionais modernos e muitos softwares modernos vantagem de múltiplos núcleos. O problema é que a programação paralela / concorrente é mais difícil do que o paradigma de programação linear padrão. Isso aumentou o tempo necessário para que muitos programas no mercado aproveitassem totalmente o poder desses processadores mais recentes, pois muitos desenvolvedores não estavam acostumados a escrever programas desse modo. Ainda existem alguns programas no mercado hoje (modernos ou antigos) que não aproveitam vários núcleos ou multiencadeamento. O programa de criptografia que você citou é um desses exemplos.
Essas duas áreas de foco dos fabricantes de chips estão intrinsecamente conectadas. Reduzindo tanto o tamanho da matriz quanto o consumo de energia de um chip, eles podem então aumentar o número de núcleos no referido chip. Eventualmente, porém, isso também atingirá uma barreira, causando outra mudança de paradigma, mais drástica.
A razão para esta mudança de paradigma é devida a nós nos aproximarmos dos limites do silício como material base para a produção de chips. Isso é algo que a Intel e outros vêm trabalhando há algum tempo. A Intel afirmou que tem uma alternativa ao silício em andamento, e provavelmente começaremos a vê-lo depois de 2017. Além desse novo material, a Intel também está analisando os transistores 3D que poderiam "triplicar efetivamente o poder de processamento". Aqui está um artigo que menciona essas duas ideias: link