Problema de estabilidade não rastreável do kernel 3.6.8 na ASUS P53E

6

Aleatoriamente, mas não depois de 10 horas de trabalho, o laptop congela. Apenas congela. Sabendo que nem todos os erros de hardware são reportados ao usuário, tentei o netconsole. Infelizmente, o netconsole também não produziu nada no momento do congelamento.

A combinação «BUSIER» também não funciona quando o sistema trava.

A única correlação que encontrei é que, normalmente, na próxima inicialização (após o desligamento forçado), o laptop consome 10W a mais de energia. Mas suspeito que possa ser por uma concidência; Esse comportamento não está limitado aos horários em que o sistema foi ligado após o congelamento. Depois de 1,5 (em média) vezes reinicializar, o consumo de energia volta ao normal.

  • O problema persiste em qualquer kernel 3.5.x - 3.7.1.
  • O problema persiste com o Wi-Fi desativado.
  • O laptop funciona muito bem com o Windows XP (nunca tentei 7 nele)
  • Eu nunca tentei o Linux de 32 bits nesta máquina.
  • Eu uso o VirtualBox e o VMWare. O enforcamento acontece também quando nenhuma máquina virtual está ligada, mas eu sei que ambos os programas inserem alguns módulos do kernel.
  • Eu uso btrfs, dm-crypt, modem Huwavei E220, bluetooth e muitas outras coisas típicas de um notebook.

...

  • Vou colar o arquivo de log / configuração que julgar necessário.

Qual é o próximo curso de ação para solucionar esse problema de congelamento?

Sabendo exatamente nada sobre as causas do problema, existe um número quase infinito de combinações para tentar. Mas talvez alguns de vocês tenham mais experiência com o hardware de depuração e possam sugerir alguns suspeitos comuns?

ATUALIZAÇÃO:

Suspeitando que o kernel mainline não-padrão do Ubuntu é um culpado, eu reinstalei todo o sistema, desta vez com o Mint14, que é baseado no Ubuntu 12.10, que por sua vez é baseado na família de kernel 3.5.x. Infelizmente, o mesmo problema: - (

UPDATE 2:

A distribuição de eventos suspensos parece ser não-Poisson (ou seja, às vezes com mais frequência, às vezes com menos frequência), mas até agora não sei como correlacioná-lo com qualquer tipo de evento. Isso acontece quando o laptop é usado de forma interativa ou não. Isso acontece quando a memória é usada (e a página do sistema é usada - zram no meu caso) e quando a memória é usada apenas em 30%.

    
por Adam Ryczkowski 07.12.2012 / 16:16

1 resposta

1

Finalmente eu entrei em algo. Eu não estou 100% de certeza, mas parece que é um mau funcionamento desagradável na placa de vídeo integrada Intel GMA HD3000. O problema pode ser acionado ao usar recursos 3D por muito tempo.

A taxa de falha não-Poisson é explicada pelo fato de que às vezes eu estava usando composição e às vezes não. Eu não consegui correlacionar a composição com os eventos suspensos.

O motivo pelo qual não obtive os problemas no Windows XP agora é óbvio: o Windows XP não usa composição e eu não joguei com ele. Portanto, nenhum 3D estava em uso. Uma vez que comecei um jogo, depois de algumas horas o adaptador gráfico caiu. Felizmente, o Windows XP (ao contrário do Linux) foi capaz de manipular mais ou menos o problema e com configurações mínimas (16 cores, 480x640 de resolução) me informou sobre a condição.

E agora as peças do quebra-cabeça se encaixam bem, e retrospectivamente acho que posso confirmar que os problemas no Linux estavam presentes somente quando a composição estava ativada.

Vou postar outra pergunta separada sobre como diagnosticar erros de placas gráficas no Linux.

    
por 15.01.2013 / 12:43