Ubuntu Box com várias placas gráficas NVIDIA

3

Eu comprei recentemente uma caixa do System76 que tem várias GPUs: uma Quadro M6000 e duas Tesla K40.

Quando faço lspci | grep -i nvidia , diz

05:00.0 VGA compatible controller: NVIDIA Corporation Device 17f0 (rev a1)
05:00.1 Audio device: NVIDIA Corporation Device 0fb0 (rev a1)
06:00.0 3D controller: NVIDIA Corporation GK110BGL [Tesla K40c] (rev a1)
09:00.0 3D controller: NVIDIA Corporation GK110BGL [Tesla K40c] (rev a1)

Então, eles estão .. Mas, quando eu faço nvidia-smi -L ele só mostra

GPU 0: Quadro M6000 (UUID: GPU-09446504-6a9e-866a-a65d-0f1d55b7657b)

e ls -l /dev/nvidia* mostra

crw-rw-rw- 1 root root 195,   0 Aug  9 03:29 /dev/nvidia0
crw-rw-rw- 1 root root 195, 255 Aug  9 03:29 /dev/nvidiactl
crw-rw-rw- 1 root root 248,   0 Aug 12 16:19 /dev/nvidia-uvm

Não posso ter certeza, mas acredito que /dev/nvidia0 seja o Quadro M6000, e talvez o fato de não haver um /dev/nvidia1 ou um /dev/nvidia2 seja outro sintoma (ou talvez a causa ) da caixa não vendo o Tesla K40's .. Além disso, meus programas de teste que chamam cudaGetDeviceCount , produz apenas uma GPU ...

Estou executando o Ubuntu 14.04.3 e instalei o cuda_7.0.28_linux.run (e instalei os drivers da NVIDIA através desse arquivo de execução).

Por que as outras placas são inacessíveis? Como posso torná-los acessíveis?

    
por bnsh 13.08.2015 / 00:52

2 respostas

2

Tudo bem! txbob acabou em fóruns devtalk nvidia me deu o suficiente ponteiros para chegar à solução.

Então, basicamente, o nouveau estava interferindo nos drivers nvidia, e mesmo que eu tenha visto um arquivo disable-nouveau em /etc/modprobe.d , ele ainda não tinha entrado em vigor, porque eu não refiz o initramfs . .

Então, para fazer isso, eu precisava fazer

rm -f /boot/initrd*
update-initramfs -c -k all
update-grub2

depois, executando nvidia-smi -L yields

GPU 0: Quadro M6000 (UUID: GPU-09446504-6a9e-866a-a65d-0f1d55b7657b)
GPU 1: Tesla K40c (UUID: GPU-e992022a-724f-8f47-e08f-a954053020e6)
GPU 2: Tesla K40c (UUID: GPU-4d14695e-3e43-bf43-a3e3-91190f696d39)

Então, tudo bem agora! Espero que isso possa ajudar alguém!

    
por 13.08.2015 / 06:56
1

Embora a questão seja bastante antiga, isso pode ajudar alguém.

Acho que o passo-chave no seu sucesso foi que você colocou na lista negra o driver nouveau e o grub reconfigurado, então o initramfs é desnecessário.

Fonte: Bumblebee em um Lenovo T440p [NVidia GT 730M] com XUbuntu / Ubuntu 16.04 LTS

    
por 17.06.2017 / 03:57