Um processador gráfico moderno é um dispositivo altamente complexo e pode ter milhares de núcleos de processamento. A Nvidia GTX 970 por exemplo tem 1664 núcleos. Esses núcleos são agrupados em lotes que funcionam juntos.
Para uma placa Nvidia, os núcleos são agrupados em lotes de 16 ou 32, dependendo da arquitetura subjacente ( Kepler ou Fermi) e cada núcleo naquele lote executaria a mesma tarefa.
A distinção entre um lote e um núcleo é importante porque, embora cada núcleo de um lote deva executar a mesma tarefa, seu conjunto de dados pode ser separado.
Sua unidade central de processamento é grande e tem apenas alguns núcleos, pois é um processador altamente generalizado, capaz de tomar decisões em larga escala e controlar o fluxo. A placa gráfica evita uma grande quantidade de controle e lógica de comutação em favor da capacidade de executar um grande número de tarefas em paralelo.
Se você insistir em ter uma foto para provar isso, a imagem abaixo (de GTX 660Ti Direta CU II TOP revisão ) mostra 5 áreas verdes que são muito semelhantes e conteriam várias centenas de núcleos cada para um total de 1344 núcleos ativos divididos entre o que parece ser 15 blocos funcionais:
Olhandodepertocadablocopareceter4conjuntosdelógicadecontrolenolado,sugerindoquecadaumdos15blocosmaioresquevocêpodevertem4unidadesSMX.
Issonosdá15*4blocosdeprocessamento(60)com32núcleoscadaparaumtotalcompletode1920núcleos,lotesdelesserãodesativadosporqueelesnãofuncionaramcorretamenteousimplesmenteparafacilitarsuaseparaçãoemdiferentesgruposdedesempenho.Issonosdariaonúmerocorretodenúcleosativos.
UmaboafontedeinformaçõessobreomapeamentodoslotesénoStackOverflow: