No passado, configurei com sucesso sistemas Ubuntu contendo GPUs NVIDIA para lançar nvidia-smi
em segundo plano de dentro de /etc/rc.local
durante a inicialização do sistema para criar os arquivos /dev/nvidia*
necessários. Depois de testar recentemente os drivers 346.46 da NVIDIA no Ubuntu 14.04 com CUDA 6.5-19 e no kernel Linux 3.13.0-48, notei que nvidia-smi
seria interrompido indefinidamente (e nunca criaria nenhum arquivo /dev/nvidia*
) durante a inicialização. Consegui contornar isso inserindo um atraso (ou seja, sleep 30
) em /etc/rc.local
imediatamente antes de lançar nvidia-smi
. Existe alguma maneira de verificar se as GPUs são de alguma forma "acessíveis" (por falta de uma palavra melhor) antes de iniciar nvidia-smi
?
Devo acrescentar que o problema parece apenas afetar as GPUs Tesla (geração Fermi); Eu não tive que adicionar atrasos para /etc/rc.local
em sistemas com GPUs GeForce (Fermi).