A atualização do BIOS corrigiu para mim. Aparece que o sistema tinha um problema ao alocar espaço de endereço. Veja a saída do dmesg para a NVIDIA para ver se há problemas durante a inicialização.
Eu tenho 6 GPUs conectados via slots PCI em uma máquina. Todos eles são reconhecidos sendo reconhecidos:
$ lspci -v | grep 'VGA'
01:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
02:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
04:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
05:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
07:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
08:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
No entanto, o driver do kernel da NVIDIA está sendo usado apenas em 4 deles:
$ lspci -v | grep -A 10 'VGA' | grep 'Kernel driver in use:'
Kernel driver in use: nvidia
Kernel driver in use: nvidia
Kernel driver in use: nvidia
Kernel driver in use: nvidia
Nos outros 2, nenhum driver de kernel é listado:
$ lspci -v | ...
07:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
Subsystem: NVIDIA Corporation GP104 [GeForce GTX 1070]
Flags: fast devsel, IRQ 18
Memory at d6000000 (32-bit, non-prefetchable) [size=16M]
Memory at <ignored> (64-bit, prefetchable)
Memory at <ignored> (64-bit, prefetchable)
I/O ports at a000 [size=128]
Expansion ROM at d7000000 [disabled] [size=512K]
Capabilities: <access denied>
Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia
Uma lista completa de uma GPU que possui um driver de kernel listado é apresentada para comparação:
05:00.0 VGA compatible controller: NVIDIA Corporation GP104 [GeForce GTX 1070] (rev a1) (prog-if 00 [VGA controller])
Subsystem: NVIDIA Corporation GP104 [GeForce GTX 1070]
Flags: bus master, fast devsel, latency 0, IRQ 325
Memory at d8000000 (32-bit, non-prefetchable) [size=16M]
Memory at c0000000 (64-bit, prefetchable) [size=256M]
Memory at b8000000 (64-bit, prefetchable) [size=32M]
I/O ports at b000 [size=128]
[virtual] Expansion ROM at d9000000 [disabled] [size=512K]
Capabilities: <access denied>
Kernel driver in use: nvidia
Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia
O 5º e o 6º gpus também não são reconhecidos em nvidia-settings
.
Como posso obter as 5ª e 6ª GPUs para começar a usar o driver do kernel da NVIDIA?
Usando: Ubuntu 17.04, versão do driver NVIDIA 375.66.
A atualização do BIOS corrigiu para mim. Aparece que o sistema tinha um problema ao alocar espaço de endereço. Veja a saída do dmesg para a NVIDIA para ver se há problemas durante a inicialização.