Falha no sistema aleatório no Ubuntu 16.04.02 [duplicado]

0

Eu reinstalei um novo Ubuntu 16.04.02 na semana passada em um laptop i7 Sandy Bridge Nvidia + Intel (Optimus graphics) que foi anteriormente instalado com as mesmas especificações sem nenhum problema.

Desde então, estou sofrendo falhas aleatórias no sistema ao escrever e-mails, editar fotos, etc. com a GPU da Nvidia ativada ou desativada (sem padrão aqui). O sistema simplesmente parou de funcionar, nenhuma mensagem de erro, nenhuma entrada, nenhum console disponível, a tela está congelada e o aquecimento da CPU cada vez mais (adivinhando desde a rotação da ventoinha) até eu desligar manualmente o computador.

Remover todos os pacotes da Nvidia parece resolver o problema, então eu suspeito que os drivers da Nvidia sejam responsáveis por isso. Em /var/log/syslog eu tenho essa linha que aparece muitas vezes:

nvidia-modeset: ERROR: GPU:0: Failed to query display engine channel state: 0x0000857d:0:0:0x00000033

Eu corro o driver nvidia-367.57 dos repositórios do Ubuntu, a pilha xserver-xorg-hwe-16.04 e o linux-generic-hwe-16.04 kernel (linux-4.8.0.39.10). É o mesmo com nvidia-375 e, pior ainda, com nvidia-378 drivers. Mas, novamente, como não é realmente repetível, pode ser apenas má sorte.

Aqui estão as últimas linhas do syslog antes de uma falha:

Feb 23 10:51:02 ouranos anacron[1277]: Job 'cron.weekly' started
Feb 23 10:51:02 ouranos anacron[3472]: Updated timestamp for job 'cron.weekly' to 2017-02-23
Feb 23 10:56:02 ouranos systemd[1]: Starting Cleanup of Temporary Directories...
Feb 23 10:56:02 ouranos systemd-tmpfiles[3506]: [/usr/lib/tmpfiles.d/var.conf:14] Duplicate line for path "/var/log", ignoring.
Feb 23 10:56:04 ouranos systemd[1]: Started Cleanup of Temporary Directories.
Feb 23 10:56:22 ouranos com.canonical.Unity.Scope.Applications[2356]: Error loading package indexes: Couldn't stat '/var/cache/software-center/xapian'
Feb 23 10:56:22 ouranos com.canonical.Unity.Scope.Applications[2356]: (unity-scope-loader:3525): unity-applications-daemon-CRITICAL **: daemon.vala:144: Failed to load Software Center index. 'Apps Available for Download' will not be listed
Feb 23 10:56:25 ouranos gnome-session[2531]: Gtk-Message: GtkDialog mapped without a transient parent. This is discouraged.
Feb 23 11:02:29 ouranos anacron[1277]: Job 'cron.weekly' terminated
Feb 23 11:02:29 ouranos anacron[1277]: Normal exit (1 job run)
Feb 23 11:06:25 ouranos thermald[1355]: sysfs write failed trip_point_0_temp
Feb 23 11:06:29 ouranos thermald[1355]: sysfs write failed trip_point_0_temp
Feb 23 11:06:36 ouranos systemd[1]: Started CUPS Scheduler.
Feb 23 11:06:37 ouranos thermald[1355]: sysfs write failed trip_point_0_temp

E outro:

Feb 23 14:05:00 ouranos gnome-session[7432]: Done!
Feb 23 14:05:13 ouranos thermald[1350]: sysfs write failed trip_point_0_temp
Feb 23 14:05:16 ouranos bluetoothd[1317]: Endpoint unregistered: sender=:1.254 path=/MediaEndpoint/A2DPSource
Feb 23 14:05:16 ouranos bluetoothd[1317]: Endpoint unregistered: sender=:1.254 path=/MediaEndpoint/A2DPSink
Feb 23 14:05:19 ouranos org.gnome.zeitgeist.Engine[7259]: ** (zeitgeist-datahub:8084): WARNING **: zeitgeist-datahub.vala:229: Unable to get name "org.gnome.zeitgeist.datahub" on the bus!
Feb 23 14:05:21 ouranos thermald[1350]: sysfs write failed trip_point_0_temp
Feb 23 14:05:29 ouranos gnome-session[7432]: ** (zeitgeist-datahub:8064): WARNING **: zeitgeist-datahub.vala:212: Error during inserting events: GDBus.Error:org.gnome.zeitgeist.EngineError.InvalidArgument: Incomplete event: interpretation, manifestation and actor are required
Feb 23 14:05:29 ouranos gnome-session[7432]: [2017-02-23T19:05:29] [ERR] hddtemp : échec de l'ouverture de la connexion.
Feb 23 14:05:29 ouranos gnome-session[7432]: [2017-02-23T19:05:29] [ERR] atasmart : échec de sk_disk_open() : /dev/sda.
Feb 23 14:05:29 ouranos gnome-session[7432]: [2017-02-23T19:05:29] [ERR] atasmart : échec de sk_disk_open() : /dev/sdb.
nvidia-modeset: ERROR: GPU:0: Failed to query display engine channel state: 0x0000857d:0:0:0x00000033
Feb 23 10:51:02 ouranos anacron[1277]: Job 'cron.weekly' started
Feb 23 10:51:02 ouranos anacron[3472]: Updated timestamp for job 'cron.weekly' to 2017-02-23
Feb 23 10:56:02 ouranos systemd[1]: Starting Cleanup of Temporary Directories...
Feb 23 10:56:02 ouranos systemd-tmpfiles[3506]: [/usr/lib/tmpfiles.d/var.conf:14] Duplicate line for path "/var/log", ignoring.
Feb 23 10:56:04 ouranos systemd[1]: Started Cleanup of Temporary Directories.
Feb 23 10:56:22 ouranos com.canonical.Unity.Scope.Applications[2356]: Error loading package indexes: Couldn't stat '/var/cache/software-center/xapian'
Feb 23 10:56:22 ouranos com.canonical.Unity.Scope.Applications[2356]: (unity-scope-loader:3525): unity-applications-daemon-CRITICAL **: daemon.vala:144: Failed to load Software Center index. 'Apps Available for Download' will not be listed
Feb 23 10:56:25 ouranos gnome-session[2531]: Gtk-Message: GtkDialog mapped without a transient parent. This is discouraged.
Feb 23 11:02:29 ouranos anacron[1277]: Job 'cron.weekly' terminated
Feb 23 11:02:29 ouranos anacron[1277]: Normal exit (1 job run)
Feb 23 11:06:25 ouranos thermald[1355]: sysfs write failed trip_point_0_temp
Feb 23 11:06:29 ouranos thermald[1355]: sysfs write failed trip_point_0_temp
Feb 23 11:06:36 ouranos systemd[1]: Started CUPS Scheduler.
Feb 23 11:06:37 ouranos thermald[1355]: sysfs write failed trip_point_0_temp
Feb 23 14:05:00 ouranos gnome-session[7432]: Done!
Feb 23 14:05:13 ouranos thermald[1350]: sysfs write failed trip_point_0_temp
Feb 23 14:05:16 ouranos bluetoothd[1317]: Endpoint unregistered: sender=:1.254 path=/MediaEndpoint/A2DPSource
Feb 23 14:05:16 ouranos bluetoothd[1317]: Endpoint unregistered: sender=:1.254 path=/MediaEndpoint/A2DPSink
Feb 23 14:05:19 ouranos org.gnome.zeitgeist.Engine[7259]: ** (zeitgeist-datahub:8084): WARNING **: zeitgeist-datahub.vala:229: Unable to get name "org.gnome.zeitgeist.datahub" on the bus!
Feb 23 14:05:21 ouranos thermald[1350]: sysfs write failed trip_point_0_temp
Feb 23 14:05:29 ouranos gnome-session[7432]: ** (zeitgeist-datahub:8064): WARNING **: zeitgeist-datahub.vala:212: Error during inserting events: GDBus.Error:org.gnome.zeitgeist.EngineError.InvalidArgument: Incomplete event: interpretation, manifestation and actor are required
Feb 23 14:05:29 ouranos gnome-session[7432]: [2017-02-23T19:05:29] [ERR] hddtemp : échec de l'ouverture de la connexion.
Feb 23 14:05:29 ouranos gnome-session[7432]: [2017-02-23T19:05:29] [ERR] atasmart : échec de sk_disk_open() : /dev/sda.
Feb 23 14:05:29 ouranos gnome-session[7432]: [2017-02-23T19:05:29] [ERR] atasmart : échec de sk_disk_open() : /dev/sdb.
%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%
%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%%pre%

(Nota: /dev/sda é o HDD local e /dev/sdb é um HDD externo USB).

Como posso encontrar um traço do que causou a falha? O erro nvidia-modeset é algo com que eu deveria me preocupar?

Como minha CPU é uma geração Sandy Bridge, o bug Baytrail que afeta o Pstate provavelmente não é a causa do problema.

    
por Aurélien Pierre 23.02.2017 / 17:05

2 respostas

0

Após algumas pesquisas, pareceu ser uma duplicata desses erros:

E relacionado a esse bug: link

Mas esta solução ( Como instalar o Kernel 4.8.5 | askubuntu.com ) não resolveu o problema. Além disso, meu CPU não é um Baytrail, mas um Sandy Bridge.

Primeiro, o log sugeriu um problema recorrente com thermald :

Feb 23 11:06:25 ouranos thermald[1355]: sysfs write failed trip_point_0_temp

Eu tive que atualizá-lo com uma versão corrigida do repo proposto pelo Ubuntu. Esse problema é mencionado aqui: link

Então, algo pareceu errado no Prime Indicator Plus, que permitiu um "Nvidia Power Management", mesmo quando o prime-select estava na Intel. Eu nunca ouvi falar dessa opção, mas os syslogs mostraram alguns bugs estranhos envolvendo o gerenciamento de energia na Nvidia.

Então eu removi o Indicador Prime Plus.

Eu acredito que uma configuração bastante agressiva da ferramenta de gerenciamento de energia TLP também causou algumas falhas, então eu também a removi.

Finalmente eu removi, purgou e reinstalei o driver Nvidia que, como asual, tem sido a minha principal fonte de estranhos bugs e travamentos desde que cometi o erro de comprar um laptop Optimus dual GPU.

Agora parece ok.

    
por Aurélien Pierre 23.02.2017 / 20:55
0

Eu tive uma experiência semelhante também. Meu PC iria desligar depois de usar o navegador da web ou jogar um pouco. Acontece que a placa de vídeo que eu tinha estava com defeito (durou cerca de 5 anos antes de fazer isso) então eu desliguei e meu PC não trava mais. Eu não sei se este é o seu caso, mas se você tiver uma placa gráfica extra, tente mudá-la para ver.

    
por Ethan V. 23.02.2017 / 17:38