Supercomputador Multi GPU

3

Eu tenho um servidor supermicro rodando o servidor Ubuntu 14.04, e gostaria de instalar um Quadro 400 (para exibição) uma Nvidia GTX 295 e uma Nvidia K80, no entanto, quando eu instalo o driver para o K80 o Quadro 400 e Nvidia GTX 295 não aparecem em nvidia-smi

Quando tento instalar os drivers para o GTX 295 (que parecem ser o mesmo que o Quadro 400) do site nvidia, ele diz que precisa desinstalar o driver instalado anteriormente (mesmo que o driver tenha sido para o K80 e não para o GTX 295)

Alguma chance de alguém já ter tido esse problema antes? e sabe como instalar e detectar múltiplos GPUs.

Eu também criei um (baseado em minhas pesquisas anteriores) eu criei um arquivo chamado blacklist-nouveau.conf em /etc/modprobe.d/ contendo o seguinte

blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

No momento em que executamos o nvidia-smi (e depois de tentar instalar todos os drivers) recebo a seguinte mensagem

Failed to initialize NVML: Unknown Error

Obrigado

    
por Anoracx 12.09.2015 / 15:43

1 resposta

0

Então esta é a solução

  1. Eu reinstalei o servidor Ubuntu 14.04
  2. eu segui os pontos 1-2 e 3 da documentação oficial
cuda-getting-started-guide-for-linux
  1. eu corri nvidia-smi que só me mostrou o K80
  2. desconectei o K80
  3. Eu instalei os drivers para o gtx295 e o quadro 400 manualmente
 sudo apt-get install nvidia-340
  1. eu repliquei o K80
  2. Reiniciou o sistema e executou o Nvidia-smi (mostrando toda a placa gráfica, mas nada parece estar acessível via código CUDA ou Nsight)

  3. então eu corri novamente (esperando que os drivers da GTX e Quadro não fossem removidos)

sudo apt-get install cuda-drivers
  1. Reiniciou o servidor

(neste momento Nvidia-smi) só me mostra o K80 .... de novo!

  1. finalmente instalei
 sudo apt-get install nvidia-cuda-toolkit
  1. reiniciei o servidor
  2. e sim, funcionou, todos eles são detectados e todas as GPUs estão disponíveis.

Todas as cartas agora aparecem na Nvidia-smi, embora pareça ter ganhado uma interface gráfica também, o que é estranho, já que não a instalei, mas é justo. Vou ver se funciona agora.

Espero que isso ajude.

    
por 12.09.2015 / 17:07