Driver do Kernel NVIDIA em uso em apenas 4 dos 6 GPUs

0

Eu tenho 6 GPUs conectados via slots PCI em uma máquina. Todos eles são reconhecidos sendo reconhecidos:

$ lspci -v | grep 'VGA'
01:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
02:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
04:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
05:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
07:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
08:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])

No entanto, o driver do kernel da NVIDIA está sendo usado apenas em 4 deles:

$ lspci -v | grep -A 10 'VGA' | grep 'Kernel driver in use:'
Kernel driver in use: nvidia
Kernel driver in use: nvidia
Kernel driver in use: nvidia
Kernel driver in use: nvidia

Nos outros 2, nenhum driver de kernel é listado:

$ lspci -v | ...
07:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
Subsystem: NVIDIA Corporation GP104 [GeForce GTX 1070]
Flags: fast devsel, IRQ 18
Memory at d6000000 (32-bit, non-prefetchable) [size=16M]
Memory at <ignored> (64-bit, prefetchable)
Memory at <ignored> (64-bit, prefetchable)
I/O ports at a000 [size=128]
Expansion ROM at d7000000 [disabled] [size=512K]
Capabilities: <access denied>
Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia

Uma lista completa de uma GPU que possui um driver de kernel listado é apresentada para comparação:

05:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
Subsystem: NVIDIA Corporation GP104 [GeForce GTX 1070]
Flags: bus master, fast devsel, latency 0, IRQ 325
Memory at d8000000 (32-bit, non-prefetchable) [size=16M]
Memory at c0000000 (64-bit, prefetchable) [size=256M]
Memory at b8000000 (64-bit, prefetchable) [size=32M]
I/O ports at b000 [size=128]
[virtual] Expansion ROM at d9000000 [disabled] [size=512K]
Capabilities: <access denied>
Kernel driver in use: nvidia
Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia

O 5º e o 6º gpus também não são reconhecidos em nvidia-settings .

Como posso obter as 5ª e 6ª GPUs para começar a usar o driver do kernel da NVIDIA?

Usando: Ubuntu 17.04, versão do driver NVIDIA 375.66.

    
por user14717 14.07.2017 / 03:00

1 resposta

1

A atualização do BIOS corrigiu para mim. Aparece que o sistema tinha um problema ao alocar espaço de endereço. Veja a saída do dmesg para a NVIDIA para ver se há problemas durante a inicialização.

    
por rinodods 01.09.2017 / 03:28