Driver NVIDIA aleatoriamente não encontrado - falha “Construindo módulos do kernel” ao reinstalar [duplicado]

2

Estou executando o Ubuntu 16.04 com uma GTX 1070. Eu uso essa máquina para o Tensorflow, com suporte a GPU ativado. Eu reiniciei meu sistema aleatoriamente no outro dia e agora não consigo fazer login. Eu posso chegar na tela de login, digite minha senha, mas depois me direciona de volta para a tela de login. Eu posso, no entanto, entrar na linha de comando através de Alt + Ctrl + F1.

Quando tento instalar um driver da origem (não acho que a versão do driver seja importante porque tentei vários outros), recebo um erro:

ERROR: An error occurred while performing the step: "Building kernel modules". See /var/log/nvidia-installer.log for details e, em seguida, The NVIDIA kernel module was not created

Eu tentei desinstalar da origem sudo ./NVIDIA-Linux-x86_64-367.57-no-compat32.run --uninstall e, em seguida, reinstalar a partir da origem, mas a mesma coisa. Eu tentei atualizar a partir da fonte sudo ./NVIDIA-Linux-x86_64-367.57-no-compat32.run --update , mas a mesma coisa acontece.

Eu tentei instalar a partir do PPA:

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-367

O que não falha totalmente, mas gera um erro relacionado ao kernel novamente: Error! Bad return status for module build on kernel: 4.4.0-53-generic

Veja o que recebo quando eu verifico o driver após a instalação do PPA:

$ nvidia-smi
modprobe: ERROR ../libkmod/libkmod-module.c:832 kmod_module_insert_module() could not find module by name='nvidia_367'
modprove: ERROR could not insert 'nvidia_367': unknown symbol in module, or unknown parameter (see dmesg)
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Maker sure that the latest NVIDIA diver is installed and running.

Isto é talvez uma questão de CUDA? Como eu iria consertar se fosse?

Devo apenas reinstalar o sistema operacional (uma nova instalação sem perder dados)?

UPDATE

Eu tenho uma ideia do que causou o problema, mas não tenho certeza de como corrigi-lo.

Mudei meu compilador padrão para clang há uma semana, e acho que o driver da NVIDIA precisa de gcc ou g++ . Não sei como alterá-lo de volta (um colega de trabalho mudou). Eu tentei este ln -s /usr/bin/gcc-4.9 ~/.local/bin/gcc mas isso não ajudou.

Este erro fala sobre um ponteiro de arquivo de configuração para clang, mas não me diz exatamente como apontá-lo de volta. Como posso apontar o arquivo de configuração de volta para gcc ?

    
por Kendall Weihe 12.12.2016 / 17:02

1 resposta

0

Acontece que era um problema do compilador. Eu acredito que eu tinha clang definido como meu compilador padrão. Eu segui as instruções de aqui e o Ubuntu agora vê meu driver NVIDIA bem.

    
por Kendall Weihe 12.12.2016 / 17:41