nvidia driver 375.51 não está funcionando corretamente no ubuntu 16.04

1

Eu atualizei os drivers nvidia esta manhã, a versão anterior era 375.26 , que é a última trabalhando na minha máquina.

Agora, quando eu nvidia-smi ele fica pendurado indefinidamente e se eu executar um código tensorflow , ele lança

E tensorflow/stream_executor/cuda/cuda_driver.cc:509] failed call to cuInit: CUDA_ERROR_UNKNOWN

enquanto, se eu executar um programa de cuda estúpido compilado com nvcc , simplesmente vai.

Quando eu dpkg -l | grep nvidia , eu tenho:

ii  nvidia-375                            375.51-0ubuntu1                            amd64        NVIDIA binary driver - version 375.51
ii  nvidia-375-dev                        375.51-0ubuntu1                            amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                       375.51-0ubuntu1                            amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                 375.51-0ubuntu1                            amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                          0.8.2                                      amd64        Tools to enable NVIDIA's Prime
ii  nvidia-settings                       375.51-0ubuntu1                            amd64        Tool for configuring the NVIDIA graphics driver

Alguém mais está enfrentando isso? Eu encontrei este por exemplo, mas não teve sucesso.

EDITAR

Eu estou em uma instância do Azure, isso é importante, veja a resposta .

    
por bio 03.05.2017 / 17:50

1 resposta

0

Isso corrige isso. Foi um problema relacionado ao kernel 4.4.0-75 do Ubuntu 16.04, já que saiu de uma resposta dada pela Microsoft a uma requisição de suporte, esta:

Canonical appears to have recently released kernel 4.4.0-75 for Ubuntu 16.04 and this is having an adverse effect on Tesla GPUs on NC-series VMs. Installation of the 4.4.0-75 breaks the 8.0.61-1 version of the NVIDIA CUDA driver that’s currently recommended for use on these systems, resulting in nvidia-smi not showing the adapters and lspci returning an error similar to the following:

root@pd-nvtest2:~# lspci lspci: Cannot open /sys/bus/pci/devices/2baf:00:00.0/resource: No such file or directory

Então, execute apt-get remove linux-image-4.4.0-75-generic - isso também instalará uma nova versão do kernel - e, em seguida, update-grub .

Em seguida, reinicie e deve funcionar!

    
por 04.05.2017 / 11:21