Uma placa de soquete duplo será configurada com dois sistemas de CPU que incluem slots de memória associados a cada soquete. Se houver dois bancos de memória, cada um será conectado a um slot da CPU. O banco de memória não estará diretamente disponível para o outro slot.
Isso implica que uma placa-mãe com capacidade de 72GB tem capacidade de 36GB por SLOT de CPU.
No entanto, se seus DIMMs forem configurados assimetricamente, como em esta placa Intel ,
Eu suspeito que você terá 24GB em uma CPU e 48GB na outra ... precisa confirmar isso.
Se você está se referindo a uma placa 1366 baseada em Nehalem, você terá uma configuração de 3 slots por slot de CPU. Você preencherá 3x DIMM DDR3 para obter sua memória por-cpu.
A arquitetura Nehalem melhora o acesso à memória a partir do outro banco de slots usando Arquitetura de memória não uniforme (NUMA) .
NUMA attempts to address this problem by providing separate memory for each processor, avoiding the performance hit when several processors attempt to address the same memory. For problems involving spread data (common for servers and similar applications), NUMA can improve the performance over a single shared memory by a factor of roughly the number of processors (or separate memory banks).
Of course, not all data ends up confined to a single task, which means that more than one processor may require the same data. To handle these cases, NUMA systems include additional hardware or software to move data between banks. This operation has the effect of slowing down the processors attached to those banks, so the overall speed increase due to NUMA will depend heavily on the exact nature of the tasks run on the system at any given time.
Quando você não está usando o Nehalem NUMA, o esquema mais antigo funciona de forma diferente, uma diferença rápida é mostrada visualmente neste página do artigo ArsTechnica . Basicamente, você tem o pior tempo de acesso para tudo (acesso à memória multi-socket com o custo total de acesso multiway).
A técnica NUMA permite melhores tempos de acesso entre os bancos. O resultado final é uma melhor taxa de transferência de memória, particularmente quando cada slot do processador tem seus dados localizados em seu banco.
Ainda não estou confiante em todos os pontos desta resposta e convido outras opiniões.