Como diagnosticar reinicializações súbitas ocasionais?

2

Eu tenho um sistema Windows XP e recentemente atualizei adicionando 2 sticks de memória RAM de 1GB aos 2x0.5GB já presentes. Desde então, cerca de uma vez por dia (o sistema é usado 8+ horas por dia), o sistema repentinamente e inesperadamente é reiniciado. Em algumas ocasiões, o sistema congelou completamente, respondendo apenas ao botão de energia sendo pressionado por vários segundos para forçar o desligamento.

Nada aparece no log de eventos do sistema que possa indicar uma possível causa - tudo parece sugerir negócios como de costume.

Soa como memória defeituosa - mas o memtest86 + diz o contrário. Um teste completo, com duração de uma hora, não encontrou problemas.

A próxima suspeita, então, é que eu derrubei algo durante a instalação da RAM. O problema é que tudo que consigo pensar em testar parece bom. Eu abri o caso e cutuquei algumas coisas, na esperança de obter um melhor contato nas conexões, etc., mas ainda não há sinais de que isso tenha feito diferença ou não.

Pensei em um acaso relacionado ao malware, mas, novamente, até onde sei, estou bem claro.

Tudo o que posso pensar em adicionar à minha lista de verificação (principalmente de coisas que não posso verificar com facilidade) é ...

  • A fonte de alimentação é (1) apenas 350W, (2) não necessariamente da melhor qualidade e (3) alimentando uma Prescott P4 640 3.2GHz. Poderia ser limítrofe sobrecarregado ou prestes a morrer? Como faço para verificar?

  • É possível que a CPU não esteja sendo resfriada adequadamente? Eu não tive o fã passado tickover normal, mesmo fazendo codificação de vídeo, e a única leitura de temperatura sã do SpeedFan é bastante estável em 36 celcius, então provavelmente não.

Alguma ideia? Existe um procedimento padrão para diagnosticar esse tipo de falha?

EDITAR

Eu finalmente resolvi esse problema, e o PC agora está trabalhando de maneira confiável (há semanas).

O problema foi o dissipador de calor - uma combinação de dois problemas, na verdade. É um processador soquete LGA775, que significa o enorme dissipador de calor que é travado na placa-mãe por meio de quatro "pernas". Uma das travas não estava trancada corretamente, provavelmente significando que eu a havia derrubado ao instalar a RAM. Isso significa que o dissipador de calor provavelmente não estava fazendo um bom contato com o processador em toda a sua superfície - ou seja, um canto do processador poderia facilmente estar quente.

Segundo assunto - a pasta térmica secou e se desintegrou, então era basicamente pó termicamente isolante.

Agora tenho um novo cooler completo - isso não era realmente necessário, mas o novo é mais silencioso.

    
por Steve314 17.03.2010 / 15:01

3 respostas

4

A partir dessa descrição, suspeito que a PSU esteja no limite de sua especificação ou esteja começando a falhar. Em ambos os casos, pode momentaneamente não fornecer a voltagem correta ou corrente em uma ou mais das linhas da placa-mãe, o que poderia causar qualquer número de erros aparentemente aleatórios.

Outra possibilidade relacionada à energia é que um dos muitos capacitores usados para suavização de energia na placa-mãe falhou (esse era um problema muito comum há alguns anos atrás, veja link para informações, incluindo o que procurar).

No padrão do XP de reinicializar automaticamente em determinados erros (que, de outra forma, resultariam em um BSOD): isso pode ser alterado. Clique com o botão direito em "meu computador", selecione "propriedades", vá para a guia "avançado", clique no botão "configurações" na seção "inicialização e recuperação", e a caixa de diálogo que aparece tem algumas opções sobre o que O kernel fará quando ocorrer um erro que não pode ser resolvido. Isso significará que você pode obter um erro útil na tela no lugar de uma reinicialização (embora o problema esteja relacionado à energia, os erros podem não ser úteis, pois o problema pode afetar diferentes partes em momentos diferentes - se você receber consistentemente um erro no mesmo módulo que pode ser uma pista útil).

    
por 17.03.2010 / 16:01
4

"Soa como memória defeituosa - mas o memtest86 + diz o contrário. Um teste completo, que demorou mais de uma hora, não encontrou problemas."

Uma hora no memtest não é um teste completo, por qualquer meio, falhas aparecem com frequência após uma hora. Corra durante a noite para obter algo mais próximo de um teste completo. E mesmo assim, isso não significa que a memória é boa, apenas que o memtest não encontrou falhas nesse período de tempo.

De qualquer forma, você não precisa rodar o memtest. O problema só aconteceu desde que você instalou a memória. Remova a nova memória e veja se o problema desaparece.

Se ele funcionar bem sem a nova memória, tente trocar a nova memória pelo antigo e veja o que acontece. Se o problema retornar, coloque de volta a memória antiga e teste a nova memória um stick de cada vez com o Memtest (pelo menos 8 horas). Se um teste bom e outro ruim, tente usar apenas o bom. Se ambos testarem bem ... bem, você ainda não poderá usá-los.

Pode ser que a memória não esteja em falta, mas a carga extra na psu quando você instala a memória extra está tornando-a doente. Improvável, mas suponho que não seja impossível.

    
por 17.03.2010 / 21:54
1

Como fonte de reinicializações aleatórias, verifico HEAT, DISK, POWER e MEMORY nessa ordem. No entanto, os congelamentos aleatórios raramente são (na minha experiência) relacionados com o poder, de modo que a memória aumenta um deles. Como fonte de reinicializações, o disco não é comum, mas erros de disco são, em geral, muito mais comuns do que erros de memória (mais uma vez, na minha experiência), portanto, verifiquei primeiro.

    
por 17.03.2010 / 20:07

Tags