Instalando os drivers NVIDIA para o ambiente sem disco

3

Estou tentando configurar um cluster de 8 computadores, além de um servidor de arquivos principal. Idealmente, gostaria de configurá-lo em um ambiente quase sem disco / quasi-stateless (isto é, o único armazenamento local é /var , onde coisas como a configuração de torque irão). Cada um dos 8 nós de computação tem 4 NVIDIA Tesla K40m, mas o servidor de arquivos raiz não tem GPU.

Idealmente, gostaria de poder criar a instalação completa no servidor de arquivos (em /node ) e depois PXE-boot para os nós de computação, mas não encontrei uma maneira de instalar o NVIDIA drivers sem uma GPU NVIDIA integrada. Eu encontrei uma pergunta nos fóruns da NVIDIA sobre como alguém tentou sem sucesso isso ...

Como alternativa, eu poderia instalar os drivers NVIDIA em um dos nós de computação (um deles está atualmente executando o CentOS em seus discos locais) para (por exemplo) /usr/local/nvidia e controlar quais arquivos ele cria e criar um tarball desse para copiar para a instalação do servidor de arquivos.

Por último, eu poderia apenas manter oito instalações separadas, mas eu não gosto disso de uma perspectiva de manutenção de longo prazo (cada nó de computação estará executando trabalhos de torque, então eu gostaria que os nós parecessem mais-ou- menos idêntico).

Em resumo, o que eu estou pedindo é isto:

  1. Posso instalar os drivers da NVIDIA sem uma GPU NVIDIA integrada?
  2. Existe alguma outra maneira que eu deveria estar fazendo sobre isso?

Para referência, estamos rodando o CentOS 7.

[root@compute-3 /]# uname -a
Linux compute-3 3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
    
por Travis DePrato 16.01.2017 / 00:20

1 resposta

2

Use pacotes RPM, como todo o resto.

No momento, os pacotes de drivers NVIDIA mais bem construídos são da Negativo17

    
por 16.01.2017 / 02:28