Como sempre, com perguntas sobre cache, a resposta seria "depende inteiramente da sua carga de trabalho". O cache é apenas de uso se seus processos em execução estiverem gastando uma quantidade significativa de tempo acessando a memória e exibindo uma localidade notável de referência para endereçamento de memória (e não satisfeitos com os caches L1 / L2 menores presentes por núcleo para este assunto).
Ter um grande número de processos em execução em diferentes encadeamentos aumenta as chances de debulhar o cache compartilhado e, assim, diminui os ganhos de desempenho que, de outra forma, poderiam ter sido obtidos. Esta é também a razão para aumentar o tamanho do cache com um aumento na contagem de núcleos - quanto mais threads competidores em memória você estiver executando, maior o cache compartilhado provavelmente precisará ser para ser útil.
Existe um artigo antigo de Tom's Hardware que compara dois chips P4 antigos com e sem cache L3 para várias cargas de trabalho de renderização / gráficas. Os números são lixo, assim como todo o benchmark, mas contém uma boa explicação da arquitetura do cache em geral e do caching L3 em particular.
A linha inferior: você provavelmente não notaria a diferença, mas se você precisa dos números exatos, você teria que comprar ambas as CPUs e executar sua carga de trabalho em ambas para comparar tempos de execução.