Antes de tudo, li as perguntas "duplicadas" e elas realmente não respondem ao meu problema.
Eu tenho um novo computador com i7-8700k e nvidia titan Xp. Eu instalei o Ubuntu 16.04 e o driver nvidia 384.111.
Agora me deparo com o seguinte problema: o Ubuntu congela e somente a reinicialização forçada é possível.
Acontece quando jogo Dota 2 via Steam e (!) também quando executo alguns cálculos de GPU com tensorflow.
Informação adicional:
born@bornexmachina:~$ uname -a
Linux bornexmachina 4.13.0-32-generic #35~16.04.1-Ubuntu SMP Thu Jan 25 10:13:43 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux
Além disso:
born@bornexmachina:~$ nvidia-smi
Sun Feb 11 22:22:03 2018
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 384.111 Driver Version: 384.111 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 TITAN Xp COLLEC... Off | 00000000:01:00.0 On | N/A |
| 30% 51C P2 63W / 250W | 11983MiB / 12180MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 1080 G /usr/lib/xorg/Xorg 411MiB |
| 0 1511 G compiz 233MiB |
| 0 2153 G ...-token=1A94804E091A866E6687A407C642BA22 161MiB |
Meu tensorflow caiu, é por isso que tenho memória cheia ocupada e apenas 3 processos são mostrados. Eu iria reiniciar depois disso.
Então, como conclusão - eu tenho um novo sistema com nova instalação do Ubuntu, Nvidia etc. E congela, apesar de usar o driver 384.111 durante jogos (sem requisitos elevados) ou durante cálculos com CUDA.Espero que a comunidade não a marque diretamente como duplicata e me dê um conselho sobre como corrigir isso.
EDIT: após o reinício nvidia-smi se parece com isso
born@bornexmachina:~$ nvidia-smi
Sun Feb 11 22:42:42 2018
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 384.111 Driver Version: 384.111 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 TITAN Xp COLLEC... Off | 00000000:01:00.0 On | N/A |
| 23% 36C P8 20W / 250W | 675MiB / 12182MiB | 21% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 1076 G /usr/lib/xorg/Xorg 437MiB |
| 0 1448 G compiz 81MiB |
| 0 2027 G ...-token=F69D2E50CC9ED7D4B945ED1B2DD6E4B9 153MiB |
+-----------------------------------------------------------------------------+