Não é possível usar a otimização da GPU da nvidia (libcublas.so)

4

Eu tenho uma Nvidia 750Ti em um servidor dedicado

Estou tentando instalar o cuda para usar a otimização da GPU em Theano.

Eu fiz várias instalações do cuda 7 (no servidor Ubuntu x86_64 12.04, servidor Ubuntu x86_64 14.04, instalando os drivers da Nvidia manualmente ...).

A instalação atual é:   - Ubuntu 14.04 (atualizado)   - cuda 6.5 (via .run)

Após cada instalação, eu tento o primeiro exemplo de GPU neste tutorial , mas continuo recebendo a mesma resposta :

THEANO_FLAGS=mode=FAST_RUN,device=gpu,floatX=float32 python check1.py
ERROR (theano.sandbox.cuda): Failed to compile cuda_ndarray.cu: libcublas.so.6.5: cannot open shared object file: No such file or directory
WARNING (theano.sandbox.cuda): CUDA is installed, but device gpu is not available  (error: cuda unavilable)
[Elemwise{exp,no_inplace}(<TensorType(float32, vector)>)]
Looping 1000 times took 1.9148170948 seconds
Result is [ 1.23178029  1.61879337  1.52278066 ...,  2.20771813  2.29967761
  1.62323284]
Used the cpu


$ ls -la /usr/local/cuda-6.5/lib64/libcublas.so
lrwxrwxrwx 1 root root 16 Jun 14 18:23 /usr/local/cuda-6.5/lib64/libcublas.so -> libcublas.so.6.5

Eu compilei os exemplos da nvidia cuda. Eu posso executar o exemplo matrixMul. Mas executar matrixMulCUBLAS me dá um erro semelhante relacionado a libcublas.so shared object

Além disso, quando executo as configurações do NVIDIA X Server, recebo:

You do not appear to be using the NVIDIA X driver. Please edit your X configuration file (just run nvidia-xconfig as root), and restart X

Eu executo:

root> nvidia-xconfig 

E receba a seguinte mensagem em troca:

WARNING: Unable to locate/open X configuration file.
New X configuration file written to '/etc/X11/xorg.conf'

Mas, apesar de nvidia-xconfig , o problema nas configurações do NVIDIA X Server ainda permanece.

Em uma das intenções, resolvi esse problema com as configurações do NVIDIA X Server. Mas isso não resolveu o problema com libcublas.

Eu defini variáveis relacionadas via /etc/environment

CUDA_HOME=/usr/local/cuda-6.5
LD_LIBRARY_PATH=/usr/local/cuda-6.5/lib64
PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/opt/anaconda/bin:/usr/local/cuda-6.5/bin"

Sou novato em GPUs e é uma grande bagunça!

    
por virilo 14.06.2015 / 20:04

2 respostas

1

Resolvido.

  • O servidor tinha duas placas gráficas. Um cartão de GPU e um cartão de bordo. Pedi à empresa de hospedagem para desligar o cartão de bordo

  • Eu estava preocupado com as configurações do NVIDIA X Server quando estava conectando via VNC. nvidia-smi me informou que tudo estava ok .

  • Eu precisava definir LD_LIBRARY_PATH usando ldconfig , não em /etc/environment , como explicado aqui .

    sudo echo "/usr/local/cuda-7.0/lib64" > /etc/ld.so.conf.d/cuda.conf
    sudo ldconfig
    

Obrigado a todos!

    
por virilo 17.06.2015 / 19:50
4

Eu resolvi o mesmo problema colocando as duas linhas seguintes no arquivo $HOME/.bashrc

export PATH=/usr/local/cuda/bin:/usr/local/cuda/lib64:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

Isso definirá algumas variáveis de ambiente para executar e gravar programas habilitados para CUDA.

    
por Yongduek Seo 25.05.2016 / 15:26