Como instalar o CUDA 8.0 no Ubuntu 16.04 com Nvidia GeForce GTX 1080

3

Estou tentando instalar o CUDA 8.0 no Ubuntu 16.04 para a Nvidia GeForce GTX 1080. Eu tinha o CUDA 7.5 instalado, mas ele não parecia ser compatível com o GTX 1080. Baixei o instalador .run da página do desenvolvedor da Nvidia, mas a instalação falha e produz o seguinte para um nvidia-installer.log

   An NVIDIA kernel module 'nvidia-drm' appears to already be loaded in

   your kernel.  This may be because it is in use (for example, by an X

   server, a CUDA program, or the NVIDIA Persistence Daemon), but this

   may also happen if your kernel was configured without support for

   module unloading.  Please be sure to exit any programs that may be

   using the GPU(s) before attempting to upgrade your driver.  If no

   GPU-based programs are running, you know that your kernel supports

   module unloading, and you still receive this message, then an error

   may have occured that has corrupted an NVIDIA kernel module's usage

   count, for which the simplest remedy is to reboot your computer.

Eu reiniciei o computador, mas isso não resolveu o problema. Como faço para descarregar o módulo 'nvidia-drm' para que eu possa instalar o 8.0 CUDA?

    
por Dirigo 28.09.2016 / 22:21

3 respostas

6

A partir da leitura do seu log, parece que você está tentando instalar o seu driver Cuda enquanto o seu X inicial está rodando e, portanto, usando o seu gpu.

Você precisa impedi-lo de usar sua GPU primeiro:

  • Remova os drivers atuais: sudo apt-get purge nvidia-cuda*

  • (opcional) - Se você deseja instalar os drivers também, execute: sudo apt-get purge nvidia-*

  • Efetue logout da sua GUI (Seu não logout é o motivo pelo qual você está recebendo a mensagem de erro). Para sair, pressione ctrl + alt + F2 .

  • Parar lightdm: sudo service lightdm stop

  • Agora você pode ir em frente e instalar os drivers, no seu caso você terá que executar algo como: sudo sh cuda_8.0.18_linux.run (substitua cuda_8.0.18_linux.run pelo nome do seu arquivo .run) .

  • NB: Você precisa ter certeza de selecionar / concordar com a opção de criar um link simbólico.

  • quando a instalação terminar, reinicie sua máquina: sudo reboot

por Tshilidzi Mudau 27.10.2016 / 14:13
2

Eu tive um problema semelhante. Acontece que havia um processo Xorg em execução na GPU que descobri usando nvidia-smi . Depois de matar este processo, as coisas foram bem instaladas.

    
por r11 11.04.2018 / 23:28
0

Para ver quem está usando a nvidia: sudo lsof | grep nvidia
então pare de serviços ou processos usando nvidia

    
por iceflame 31.07.2018 / 09:00