Um núcleo da CPU (exceto hyperthreading ou similar) só pode executar um processo de cada vez. Em um servidor da Web comum ou de desktop, ele alterna entre processos muito rapidamente para criar a ilusão de que vários processos estão sendo executados simultaneamente. No entanto, isso diminui o desempenho geral da CPU, já que a comutação tem custos (troca, invalidação de cache, comutadores de contexto). Isso não importa quando o núcleo passa a maior parte do tempo esperando por E / S (como entrada de usuário / conexões de rede), mas em HPC / HTC (o principal caso de uso para o mecanismo de grade) cada programa é escrito para fazer uso eficiente de recursos para que você faça o trabalho mais rapidamente se você tiver um sistema em lotes que organize os programas para serem executados um após o outro, em vez de alternar entre eles.
Em tais circunstâncias, o mecanismo de grade é normalmente configurado para usar slots para representar os núcleos, a fim de evitar comprometimento excessivo.
O mecanismo de grade pode ser configurado para rastrear a memória separadamente dos núcleos / slots.