Possível duplicação , mas essa postagem está na janela do MS, a minha está no Linux e eu não consegui resolver o problema lendo esse post.
Especificações:
Notas: esta é uma plataforma de mineração.
5 GPUs conectadas à placa-mãe através de risers PCIe x1, a 6ª GPU conecta-se à placa-mãe através do slot M2. Risers PCIe e GPUs não são o problema, porque para qualquer combinação de 4 de 6 placas. O sistema funciona como esperado.
Quando todas as 6 placas são instaladas na placa-mãe,
lspci | grep -i vga
informa todos os 6 cartões com busID de 1 a 6, mas somente 4 são detectados por nvidia-smi
e operam.
dmesg | grep -i nvidia
relata isso para os 2 cartões não detectados pelo smi (busID 4 e 5, 5 e 6, ou 4 e 6):
NVRM: This PCI I/O region assigned to your NVIDIA device is invalid:
Então, eu pensei que meu chipset não tivesse pistas PCIe suficientes e o x4 do M2 ocupasse toda a pista, mas quando eu olho na página principal da Intel. O chipset Intel H170 (meu chipset de placas-mãe) tem 16 pistas PCIe. Minhas 5 GPUs (x1), 2 das quais usam faixas de CPU (o slot x8 e x16), então 3 + 4 (o slot M2) = 7 pistas tiradas dos chipsets 16 pistas PCIe. Portanto, minha placa-mãe deve ser capaz de lidar com 6 GPUs, certo? Como faço isso acontecer?