Isso se deve a uma combinação de recursos de processadores modernos.
A primeira coisa que contribui para um alto IPS é o fato de que os processadores modernos têm várias unidades de execução que podem operar de forma independente. Na imagem abaixo (emprestada de Wikipedia: Intel Core Microarchitecture ) você pode ver na parte inferior que existem oito unidades de execução (mostradas em amarelo) que podem todas executar instruções simultaneamente. Nem todas essas unidades podem proteger os mesmos tipos de instrução, mas pelo menos 5 delas podem executar uma operação da ALU e há três unidades com capacidade SSE.
Combineissocomumlongopipelinedeinstruções
Cada instrução pode levar alguns ciclos de clock para ser executada, mas se você conseguir paralelizar com eficácia a sua execução, você poderá dar um grande impulso ao IPS, ao custo da complexidade do processador e da saída térmica.
Manter esses pipelines grandes cheios de instruções também precisa de um cache grande que possa ser preenchido com instruções e dados. Isso contribui para o tamanho do dado e também a quantidade de calor que o processador produz.
A razão pela qual isso não é feito em processadores menores é porque aumenta substancialmente a quantidade de lógica de controle necessária em torno dos núcleos de processamento, bem como a quantidade de espaço necessária e também o calor gerado. Se você quer um processador pequeno, de baixa potência e altamente responsivo, então você quer um pipeline curto sem muito material "extra" em torno dos núcleos funcionais reais. Normalmente, eles minimizam o cache, restringem-no a apenas um de cada tipo de unidade necessário para processar instruções e reduzem a complexidade de cada parte.
Eles poderiam tornar um processador pequeno tão complexo quanto um processador maior e alcançar um desempenho similar, mas então os requisitos de consumo de energia e resfriamento seriam aumentados exponencialmente.