Congelamento do Ubuntu / Titan Xp / driver 384.111 instalado

0

Antes de tudo, li as perguntas "duplicadas" e elas realmente não respondem ao meu problema.

Eu tenho um novo computador com i7-8700k e nvidia titan Xp. Eu instalei o Ubuntu 16.04 e o driver nvidia 384.111.

Agora me deparo com o seguinte problema: o Ubuntu congela e somente a reinicialização forçada é possível.

Acontece quando jogo Dota 2 via Steam e (!) também quando executo alguns cálculos de GPU com tensorflow.

Informação adicional:

born@bornexmachina:~$ uname -a
Linux bornexmachina 4.13.0-32-generic #35~16.04.1-Ubuntu SMP Thu Jan 25 10:13:43 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux

Além disso:

born@bornexmachina:~$ nvidia-smi
Sun Feb 11 22:22:03 2018       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 384.111                Driver Version: 384.111                   |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  TITAN Xp COLLEC...  Off  | 00000000:01:00.0  On |                  N/A |
| 30%   51C    P2    63W / 250W |  11983MiB / 12180MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1080      G   /usr/lib/xorg/Xorg                           411MiB |
|    0      1511      G   compiz                                       233MiB |
|    0      2153      G   ...-token=1A94804E091A866E6687A407C642BA22   161MiB |

Meu tensorflow caiu, é por isso que tenho memória cheia ocupada e apenas 3 processos são mostrados. Eu iria reiniciar depois disso.

Então, como conclusão - eu tenho um novo sistema com nova instalação do Ubuntu, Nvidia etc. E congela, apesar de usar o driver 384.111 durante jogos (sem requisitos elevados) ou durante cálculos com CUDA.

Espero que a comunidade não a marque diretamente como duplicata e me dê um conselho sobre como corrigir isso.

EDIT: após o reinício nvidia-smi se parece com isso

born@bornexmachina:~$ nvidia-smi
Sun Feb 11 22:42:42 2018       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 384.111                Driver Version: 384.111                   |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  TITAN Xp COLLEC...  Off  | 00000000:01:00.0  On |                  N/A |
| 23%   36C    P8    20W / 250W |    675MiB / 12182MiB |     21%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1076      G   /usr/lib/xorg/Xorg                           437MiB |
|    0      1448      G   compiz                                        81MiB |
|    0      2027      G   ...-token=F69D2E50CC9ED7D4B945ED1B2DD6E4B9   153MiB |
+-----------------------------------------------------------------------------+
    
por Alex 11.02.2018 / 22:26

0 respostas