Arquitetura Nvidia Pascal: DMA Tamanho / quantidade máxima de RAM do sistema host?

1

Estamos planejando construir um par de servidores Linux multi-GPU para tarefas de aprendizado de máquina e ciência de dados. De acordo com nossos requisitos, precisamos colocar muita memória RAM nessas máquinas; estamos planejando LRDIMMs de 64GiB 24x para um total de 1,5TiB. Para as GPUs, íamos usar o Titan X's para obter o melhor retorno do investimento, mas de acordo com Documentação do driver Linux da Nvidia , os cartões atuais não podem manipular mais de 1TiB de RAM do sistema host. Ouvi "rumores" de que a arquitetura Pascal virá com mais recursos de endereçamento, mas não consigo encontrar nenhuma documentação confiável para confirmar ou contradizer isso. Se isso for verdade, poderemos usar as novas placas GTX 1080, mesmo que tenham menos 4GiB de RAM na placa gráfica.

Daí a minha pergunta: há alguma documentação sobre as capacidades de endereçamento do Pascal que estou perdendo?

Ou, como alternativa, alguém com acesso a uma GTX 1080 pode executar uma% grep DMA /proc/driver/nvidia/gpus/domain:bus:device.function/information para mim?

    
por mvoelske 12.07.2016 / 12:48

1 resposta

0

Respondendo minha própria pergunta para referência futura. Nós decidimos ir com os cartões GTX 1080. Na versão do driver 367.57 , eles relatam os seguintes recursos de DMA:

$ grep DMA /proc/driver/nvidia/gpus/0000\:04\:00.0/information
DMA Size:    47 bits
DMA Mask:    0x7fffffffffff

Como tal, eles devem ser capazes de endereçar até cerca de 140 terabytes de RAM do sistema host - mais do que suficiente para nosso caso de uso.

    
por 04.11.2016 / 09:37