De vez em quando, meu laptop irá falhar. A tela irá congelar, incluindo o cursor, as luzes de bloqueio (caps lock e similares) serão desligadas se estiverem ligadas, embora minhas luzes de bateria, energia e Wi-Fi ainda funcionem. Não tenho certeza se é um kernel panic, porque às vezes ele apenas congela, então o mesmo som que faz quando eu desligo o botão liga / desliga e, em seguida, reinicia. Outras vezes, vejo uma tela de texto (não como o texto de inicialização) e, em seguida, ele reinicia da mesma maneira. Eu acho que vi 'kernel' e 'pânico' em linhas diferentes. Mas não tenho certeza.
Originalmente, achei que era um problema de calor porque ele parou de acontecer quando coloquei meu laptop em um ventilador em uma superfície rígida, e isso só acontecia quando eu visitava um site com muitos recursos. Então eu pensei que era um problema de memória porque o calor estava sendo cuidado, mas a memória estava transbordando na partição swap. Mas agora ele está travando mesmo quando o uso da memória está baixo e o calor não está disparando alarmes no psensor (tenho alarmes programados para disparar a 60C para qualquer componente, e tenho certeza que não chegou a 80C desde que eu parei usando meu laptop no meu colo).
Tecnicamente, isso não é o Ubuntu. É o Debian 8.2; mas todas as minhas outras questões Debian são respondidas através do askubuntu. É um Dell Inspiron 1520, originalmente com um WindowsXP os (nós limpamos o disco rígido antes de instalar o Debian), e tem 2Gb de RAM. No entanto, acredito que minha pergunta é sobre o Linux em geral, não uma versão específica do Ubuntu ou Debian.
Eu não sei o que preciso verificar ou como verificar isso, como determinar o que é um problema no kernel, etc. Aqui está o que eu ouvi que preciso examinar (só existe lá para abrir arquivos de texto):
Dois ou três deles estão em branco.
Eu não consegui isolar nada no kern.log até recentemente, porque eu sempre reiniciava meu computador. Naquele tempo mais recente, forcei-o a desligar em vez de andar em pânico. E deixei por alguns dias. A última coisa do dia em que foi desligado foi:
Oct 17 22:51:27 darty kernel: [ 299.816045] mce: [Hardware Error]: Machine check events logged
Tudo isso é muito repetitivo e é idêntico a cinco minutos antes do erro. (Tem sido desligado dentro de cinco minutos em alguns casos.)
syslog não contém nada de antes de hoje.
sudo / usr / sbin / mcelog & gt; mcelog.out não retorna nada, embora o arquivo contenha um monte de gobbeldygook; Estou assumindo que é código de máquina ou algo assim.
Então ... sim. Eu estou em uma perda completa sobre o que fazer para determinar qual é o erro. Eu posso reproduzi-lo quase que de forma confiável, fazendo certas coisas no site CodinGame.com (Eu sei que a antiga sabedoria é "Se dói, não faça isso." Bem, a razão pela qual eu tenho um computador é para que eu possa faça coisas como CodinGame.A analogia disso com a médica seria "Não se levante e ande por aí".) Novamente, não é calor nem memória. Eu tenho sensores em ambos os que estão ligados ao painel.
== Editar == Meu primo e eu rodamos o memtest86, depois de limpar o disco rígido, antes de instalarmos qualquer sistema operacional, a partir de um disco memtest dedicado. Ah, e a versão do kernel é 3.16.0-4-amd64 Meu primo disse que isso pode ser importante, mas eu não acho que deveria para essa pergunta.
TL; DR: Como encontrar os arquivos certos para descobrir por que um computador está falhando?