Eu aprendi recentemente que o Sandy Bridge usa um cache de microinstruções semelhante ao cache de rastreamento de execução no Netburst. Pelo que eu sei, muitas das instruções mais simples do x86 (aquelas traduzidas em 4 micro-instruções ou menos) são decodificadas por decodificadores conectados sem qualquer ajuda da ROM do microcódigo, que é um processo rápido e simples, sem consulta à tabela. Então, por que um cache de micro-instruções decodificadas e depois procurá-las mais tarde, quando elas podem ser mais facilmente traduzidas pelo circuito do decodificador.
O cache é usado apenas para instruções mais complexas envolvendo a pesquisa de ROM de microcódigo? Ou existe alguma sabedoria superior envolvida.