Como descobrir por que um computador está falhando? [fechadas]

3

De vez em quando, meu laptop irá falhar. A tela irá congelar, incluindo o cursor, as luzes de bloqueio (caps lock e similares) serão desligadas se estiverem ligadas, embora minhas luzes de bateria, energia e Wi-Fi ainda funcionem. Não tenho certeza se é um kernel panic, porque às vezes ele apenas congela, então o mesmo som que faz quando eu desligo o botão liga / desliga e, em seguida, reinicia. Outras vezes, vejo uma tela de texto (não como o texto de inicialização) e, em seguida, ele reinicia da mesma maneira. Eu acho que vi 'kernel' e 'pânico' em linhas diferentes. Mas não tenho certeza.

Originalmente, achei que era um problema de calor porque ele parou de acontecer quando coloquei meu laptop em um ventilador em uma superfície rígida, e isso só acontecia quando eu visitava um site com muitos recursos. Então eu pensei que era um problema de memória porque o calor estava sendo cuidado, mas a memória estava transbordando na partição swap. Mas agora ele está travando mesmo quando o uso da memória está baixo e o calor não está disparando alarmes no psensor (tenho alarmes programados para disparar a 60C para qualquer componente, e tenho certeza que não chegou a 80C desde que eu parei usando meu laptop no meu colo).

Tecnicamente, isso não é o Ubuntu. É o Debian 8.2; mas todas as minhas outras questões Debian são respondidas através do askubuntu. É um Dell Inspiron 1520, originalmente com um WindowsXP os (nós limpamos o disco rígido antes de instalar o Debian), e tem 2Gb de RAM. No entanto, acredito que minha pergunta é sobre o Linux em geral, não uma versão específica do Ubuntu ou Debian.

Eu não sei o que preciso verificar ou como verificar isso, como determinar o que é um problema no kernel, etc. Aqui está o que eu ouvi que preciso examinar (só existe lá para abrir arquivos de texto):

  • scite /var/log/kern.log
  • scite /etc/rsyslog.conf
  • scite /etc/rsyslog.d /
  • scite /etc/rsyslog.d/50-default.conf
  • scite / var / log / syslog
  • sudo / usr / sbin / mcelog & gt; mcelog.out

Dois ou três deles estão em branco.

Eu não consegui isolar nada no kern.log até recentemente, porque eu sempre reiniciava meu computador. Naquele tempo mais recente, forcei-o a desligar em vez de andar em pânico. E deixei por alguns dias. A última coisa do dia em que foi desligado foi:

Oct 17 22:51:27 darty kernel: [  299.816045] mce: [Hardware Error]: Machine check events logged

Tudo isso é muito repetitivo e é idêntico a cinco minutos antes do erro. (Tem sido desligado dentro de cinco minutos em alguns casos.)

syslog não contém nada de antes de hoje.

sudo / usr / sbin / mcelog & gt; mcelog.out não retorna nada, embora o arquivo contenha um monte de gobbeldygook; Estou assumindo que é código de máquina ou algo assim.

Então ... sim. Eu estou em uma perda completa sobre o que fazer para determinar qual é o erro. Eu posso reproduzi-lo quase que de forma confiável, fazendo certas coisas no site CodinGame.com (Eu sei que a antiga sabedoria é "Se dói, não faça isso." Bem, a razão pela qual eu tenho um computador é para que eu possa faça coisas como CodinGame.A analogia disso com a médica seria "Não se levante e ande por aí".) Novamente, não é calor nem memória. Eu tenho sensores em ambos os que estão ligados ao painel.

== Editar == Meu primo e eu rodamos o memtest86, depois de limpar o disco rígido, antes de instalarmos qualquer sistema operacional, a partir de um disco memtest dedicado. Ah, e a versão do kernel é 3.16.0-4-amd64 Meu primo disse que isso pode ser importante, mas eu não acho que deveria para essa pergunta.

TL; DR: Como encontrar os arquivos certos para descobrir por que um computador está falhando?

    
por RoboticRenaissance 20.10.2015 / 00:39

0 respostas