Nessas CPUs, cada núcleo físico possui seu próprio cache L2. O cache L3 é compartilhado por todos os núcleos e é inclusivo - ou seja, todos os dados que residem no cache L2 de qualquer núcleo também residem no cache L3.
Embora isso possa parecer um desperdício de espaço L3, ele realmente torna a L3 inestimável para acelerar as operações de memória entre núcleos. O objetivo principal do cache L3 é atuar como uma área de comutação e área de teste para os núcleos. Por exemplo, se um núcleo quiser saber se uma região de memória pode ser armazenada em cache por outro núcleo, ele poderá verificar o cache L3. Se as informações foram processadas por um núcleo e as próximas precisam ser processadas por outro núcleo, elas são entregues através do cache L3, em vez da memória mais lenta fora do chip. Além disso, seu impacto no desempenho não é tão grande, exceto por algoritmos incomuns - o cache L2 é grande o suficiente para coisas pequenas e o cache L3 é muito pequeno para coisas grandes.
Portanto, embora cada núcleo tenha seu próprio cache L2 de 256 KB e efetivamente 256 KB reservados no cache L3, o saldo é compartilhado por todos os núcleos. Atividades menos importantes em outros núcleos podem prejudicar o desempenho de uma tarefa mais importante que se beneficia do uso do espaço L3. Mas pelas razões que mencionei, geralmente não é um efeito significativo na prática e geralmente não vale a pena se preocupar em otimizar operações de "dados em massa" (como compactação e varredura) para minimizar a poluição do cache. (Por exemplo, usando operações não temporais.)