GPUs não são reconhecidos pela nvidia-smi

1

Possível duplicação , mas essa postagem está na janela do MS, a minha está no Linux e eu não consegui resolver o problema lendo esse post.

Especificações:

Notas: esta é uma plataforma de mineração.

5 GPUs conectadas à placa-mãe através de risers PCIe x1, a 6ª GPU conecta-se à placa-mãe através do slot M2. Risers PCIe e GPUs não são o problema, porque para qualquer combinação de 4 de 6 placas. O sistema funciona como esperado.

Quando todas as 6 placas são instaladas na placa-mãe,

lspci | grep -i vga

informa todos os 6 cartões com busID de 1 a 6, mas somente 4 são detectados por nvidia-smi e operam.

dmesg | grep -i  nvidia

relata isso para os 2 cartões não detectados pelo smi (busID 4 e 5, 5 e 6, ou 4 e 6):

NVRM: This PCI I/O region assigned to your NVIDIA device is invalid:

Então, eu pensei que meu chipset não tivesse pistas PCIe suficientes e o x4 do M2 ocupasse toda a pista, mas quando eu olho na página principal da Intel. O chipset Intel H170 (meu chipset de placas-mãe) tem 16 pistas PCIe. Minhas 5 GPUs (x1), 2 das quais usam faixas de CPU (o slot x8 e x16), então 3 + 4 (o slot M2) = 7 pistas tiradas dos chipsets 16 pistas PCIe. Portanto, minha placa-mãe deve ser capaz de lidar com 6 GPUs, certo? Como faço isso acontecer?

    
por Nhu Thai Sanh Nguyen 08.08.2017 / 12:34

0 respostas