Estou usando uma instância de gpu da AWS com 1 NVIDIA gpu. Eu recentemente instalei drivers nvidia e o kit de ferramentas usando ./cuda_7.5.18_linux.run
. Eu reiniciei a instância e quando tentei executar o nvidia-smi
, recebi esta mensagem:
ubuntu@[redacted]:~$ nvidia-smi
Failed to initialize NVML: GPU access blocked by the operating system
Eu verifiquei se a GPU ainda era reconhecida pela máquina, o que é:
ubuntu@[redacted]:~$ lspci | grep -i nv
00:03.0 VGA compatible controller: NVIDIA Corporation GK104GL [GRID K520] (rev a1)
O que poderia estar causando isso?
editar:
Corri sudo nvidia-installer --update
e atualizei o driver e agora nvidia-smi
é executado corretamente. A versão do driver é 367.27.
No entanto, quando tento executar um programa com o Theano, que utiliza a GPU via CUDA, recebo este erro:
CUDA is installed, but device gpu is not available
(error: Unable to get the number of gpus available: unknown error)
Editar 2: Eu não sei qual era o problema, mas acabei de criar um novo servidor e usei