Como encontrar o que faz meu notebook falhar?

1

Eu tenho um novo notebook e ele cai com frequência.

$ uname -a
Linux bpgergo-notebook 4.2.0-27-generic #32-Ubuntu SMP Fri Jan 22 04:49:08 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux

$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 15.10
Release:    15.10
Codename:   wily

Não é possível especificar nenhuma circunstância ou aplicativo específico para a falha. Eu gostaria de descobrir a causa do acidente. Vou descrever como se parece quando ele trava e o que eu posso ver no syslog. Eu gostaria que você me dissesse como proceder para encontrar a causa.

Como fica quando falha

Às vezes, o congelamento ocorre em um de nossos reinícios, em outro momento dentro de 2 dias. Por exemplo. Quando este último congelamento aconteceu, após a reinicialização eu apenas iniciei alguns aplicativos comuns como um navegador e um terminal, deixei ele sozinho por uma hora e quando voltei para ele, notei que ele não respondeu a nada. Nem mesmo para alt + ctl + F1. A única coisa que posso fazer neste momento é manter o botão liga / desliga pressionado até que seja desligado.

Quando o congelamento acontece, eu costumo notar que o notebook está um pouco mais quente do que deveria. Se eu reiniciar imediatamente e checar sensors , então eu posso ver temperaturas como 70 graus Celsius que não são extremas, mas muito mais altas que a temperatura normal de operação, que é em torno de 50.

syslogs

Eu verifiquei o / var / log / syslog, isto é o que eu encontrei para ser as últimas linhas de log antes que ele falisse. chrash1:

Feb 10 15:01:39 bpgergo-notebook kernel: [26093.242080] nouveau E[   PIBUS][0000:01:00.0] HUB0: 0x6013d4 0xffff5703 (0x1c408200)
Feb 10 15:01:39 bpgergo-notebook kernel: [26093.242132] nouveau E[   PIBUS][0000:01:00.0] HUB0: 0x10ecc0 0xffffffff (0x1a40822c)
Feb 10 15:02:09 bpgergo-notebook kernel: [26123.130129] ACPI Warning: \_SB_.PCI0.PEG0.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150619/nsarguments-95)
Feb 10 15:02:09 bpgergo-notebook kernel: [26123.130403] ACPI: \_SB_.PCI0.PEG0.PEGP: failed to evaluate _DSM
Feb 10 15:02:09 bpgergo-notebook kernel: [26123.130407] ACPI Warning: \_SB_.PCI0.PEG0.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150619/nsarguments-95)
Feb 10 15:02:11 bpgergo-notebook kernel: [26124.445525] nouveau E[   PIBUS][0000:01:00.0] HUB0: 0x10ecc0 0xffffffff (0x1c40822c)

crash 2

Feb 10 16:17:58 bpgergo-notebook kernel: [ 1088.808587] nouveau E[   PIBUS][0000:01:00.0] HUB0: 0x6013d4 0xffff5700 (0x1c408200)
Feb 10 16:18:23 bpgergo-notebook kernel: [ 1113.486503] ACPI Warning: \_SB_.PCI0.PEG0.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150619/nsarguments-95)
Feb 10 16:18:23 bpgergo-notebook kernel: [ 1113.487291] ACPI: \_SB_.PCI0.PEG0.PEGP: failed to evaluate _DSM
Feb 10 16:18:23 bpgergo-notebook kernel: [ 1113.487305] ACPI Warning: \_SB_.PCI0.PEG0.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150619/nsarguments-95)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.831356] nouveau E[    PBUS][0000:01:00.0] MMIO read of 0x00000000 FAULT at 0x122130 [ IBUS ]
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835021] nouveau E[   PIBUS][0000:01:00.0] HUB0: 0xbad00100 0xbadf1002 (0xbad00100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835247] nouveau E[   PIBUS][0000:01:00.0] ROP4: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835252] nouveau E[   PIBUS][0000:01:00.0] ROP6: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835257] nouveau E[   PIBUS][0000:01:00.0] ROP7: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835262] nouveau E[   PIBUS][0000:01:00.0] ROP9: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835267] nouveau E[   PIBUS][0000:01:00.0] ROP11: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835271] nouveau E[   PIBUS][0000:01:00.0] ROP12: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835276] nouveau E[   PIBUS][0000:01:00.0] ROP13: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835281] nouveau E[   PIBUS][0000:01:00.0] ROP15: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835286] nouveau E[   PIBUS][0000:01:00.0] GPC8: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835293] nouveau E[   PIBUS][0000:01:00.0] GPC20: 0x000000 0x00000000 (0x00000000)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835298] nouveau E[   PIBUS][0000:01:00.0] GPC22: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835303] nouveau E[   PIBUS][0000:01:00.0] GPC23: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835308] nouveau E[   PIBUS][0000:01:00.0] GPC25: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.835312] nouveau E[   PIBUS][0000:01:00.0] GPC27: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.854481] nouveau E[   PIBUS][0000:01:00.0] GPC28: 0xbad00100 0xbad00100 (0xbad00100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.877204] nouveau E[   PIBUS][0000:01:00.0] GPC29: 0xbad00100 0xbad00100 (0xbad00100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.900634] nouveau E[   PIBUS][0000:01:00.0] GPC31: 0xbad00100 0xbad00100 (0xbad00100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1116.992570] nouveau E[    PBUS][0000:01:00.0] MMIO read of 0x00000000 FAULT at 0x120058 [ IBUS TIMEOUT ]
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.072344] nouveau E[   PIBUS][0000:01:00.0] HUB0: 0xbad00100 0xbad00100 (0xbad00100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078887] nouveau E[   PIBUS][0000:01:00.0] ROP4: 0xbad00100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078904] nouveau E[   PIBUS][0000:01:00.0] ROP6: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078910] nouveau E[   PIBUS][0000:01:00.0] ROP7: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078917] nouveau E[   PIBUS][0000:01:00.0] ROP9: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078923] nouveau E[   PIBUS][0000:01:00.0] ROP11: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078939] nouveau E[   PIBUS][0000:01:00.0] ROP12: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078945] nouveau E[   PIBUS][0000:01:00.0] ROP13: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078950] nouveau E[   PIBUS][0000:01:00.0] ROP15: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078954] nouveau E[   PIBUS][0000:01:00.0] GPC8: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078960] nouveau E[   PIBUS][0000:01:00.0] GPC20: 0x000000 0x00000000 (0x00000000)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078964] nouveau E[   PIBUS][0000:01:00.0] GPC22: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078968] nouveau E[   PIBUS][0000:01:00.0] GPC23: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078971] nouveau E[   PIBUS][0000:01:00.0] GPC25: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078975] nouveau E[   PIBUS][0000:01:00.0] GPC27: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078978] nouveau E[   PIBUS][0000:01:00.0] GPC28: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078982] nouveau E[   PIBUS][0000:01:00.0] GPC29: 0xbadf1100 0xbadf1100 (0xbadf1100)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078987] nouveau E[   PIBUS][0000:01:00.0] GPC31: 0x000000 0x00000000 (0x00000000)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.078997] nouveau E[    PBUS][0000:01:00.0] MMIO read of 0x00000000 FAULT at 0x120058 [ IBUS TIMEOUT ]
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.079008] nouveau E[   PIBUS][0000:01:00.0] HUB0: 0x136928 0xbadf1100 (0x19400200)
Feb 10 16:18:26 bpgergo-notebook kernel: [ 1117.079014] nouveau E[   PIBUS][0000:01:00.0] ROP0: 0x10f904 0xffffffff (0x1e408201)
    
por bpgergo 10.02.2016 / 17:46

1 resposta

0

Então, para responder minha pergunta,

  1. descubra qual é o programa ou pacote que está escrevendo as últimas linhas no syslog antes do acidente
  2. este diretório também deve ser verificado: /var/crash/

Como os comentaristas apontaram, o nouveau é o driver nvidia de código aberto.

Em relação ao problema concreto, eu instalei o driver nvidia proprietário, desde então eu não tive mais nenhum crash.

    
por 11.02.2016 / 19:02