Como posso diagnosticar uma tela azul de “Malfunction de hardware”?

5

Atualização 3/10/2011 (2): A alternância de slots de disco rígido permite novamente que o Windows seja carregado, mas os travamentos são muito mais frequentes do que eram anteriormente. É claro que o problema tem a ver com o controlador do disco rígido ... Ou uma conexão solta em qualquer outro lugar do sistema: (

Atualização 3/10/2011: Depois de alternar os componentes, o sistema começou a se recusar a inicializar (sem bipes, sem vídeo). Eu o removi do case e consegui inicializar novamente trocando os discos rígidos para um slot diferente. O Windows pediu para reiniciar devido a alterações de hardware e eu o permiti. Depois disso, meu sistema falhou ao iniciar o Windows (ele reinicia após a tela "carregar o Windows").

Neste ponto, meu palpite é que o controlador RAID ou os slots SATA da placa-mãe ficaram danificados. Espero que a falha na inicialização não seja causada por danos subsequentes causados durante a solução de problemas. No entanto, eu ainda tenho que fazer um teste real no sistema falhar, então eu ainda estou um pouco confuso.

Atualização 3/9/2011: Depois de mover minha placa de vídeo para um slot PCIe x16 diferente, consegui executar o meu caso de teste sem erros. Movê-lo de volta resultou em erros imediatos novamente. Eu estarei passando esta noite e amanhã recuperando o meu PC o suficiente para executar testes mais extenuantes e espero ter mais certeza.

Naturalmente, assim que publiquei acima, o caso de teste falhou com a mesma mensagem de erro. Aparentemente, o caso de teste não é tão confiável quanto eu pensava que fosse.

Meu computador de repente começou a bater em uma tela azul com o seguinte texto:

hardware malfunction

call your hardware vendor for support

*the system has halted*

O acidente ocorre aleatoriamente durante o uso normal. Até agora sempre consegui reproduzi-lo transferindo o conteúdo de uma pasta grande ... Mas não tenho certeza se isso é causado pela transferência de arquivos, ou simplesmente porque a transferência demora o suficiente para que outra coisa acione-a .

Um pouco sobre meu hardware

Eu tenho um processador Intel dual core e placa-mãe Asus. A placa de vídeo é da nVidia e se conecta via PCIe. Meus discos rígidos estão em pares e se conectam via SATA a um controlador RAID na placa-mãe. Eles estão configurados para usar uma configuração RAID0.

O que eu tentei até agora

Não há nada no log de eventos do Windows.

O WhoCrashed não conseguiu encontrar nenhum registro de falha.

O ScanDisk é executado até a conclusão (ele inicia antes da carga do Windows) e não informa erros.

MemTest não relata erros (para cobertura de 200%).

As temperaturas do sistema estão na faixa de 40 a 50 graus Celsius, com temperaturas da placa de vídeo na faixa de 60 a 80 graus Celsius.

Eu limpei o sistema para uma configuração mínima (disco rígido, placa de vídeo, um módulo de memória, placa-mãe, CPU, fonte de alimentação). O problema ainda ocorre.

Redefini o CMOS removendo a bateria da placa-mãe por um longo período de tempo.

No entanto, isso me permitiu descartar alguns componentes:

Não é a placa de vídeo porque o problema ainda ocorreu depois de substituir a placa de vídeo outra que eu tinha disponível.

Não é o disco rígido ou nada relacionado a software porque o problema ocorreu após uma nova instalação do Windows em um disco rígido de substituição.

Não são os cabos do disco rígido porque substituí os com os novos e ainda tive o problema.

Não é a fonte de alimentação porque o problema ainda ocorreu depois de substituir a fonte de alimentação por outra que eu tinha disponível.

provavelmente não é a memória porque eu tentei três módulos de memória diferentes em três slots de memória diferentes e ainda consegui replicar o problema.

É provavelmente não é um problema de aterramento da placa-mãe contra o gabinete porque eu removi completamente a placa-mãe do gabinete e ainda encontro o problema.

Há algo que eu possa fazer para confirmar o que está causando o problema? No momento, parece que deve ser a placa-mãe ou a CPU, mas esses são componentes difíceis de serem substituídos ... Além disso, ambos os componentes são relativamente novos (dois ou três anos).

Terei todo o prazer em editar qualquer informação adicional em que possa colocar as minhas mãos e / ou focar a pergunta, pois posso encontrar mais detalhes ...

    
por AaronSieb 09.03.2011 / 00:18

2 respostas

7

Como você eliminou alguns itens de hardware e seu sistema não permite que um dump seja gravado, é mais provável que seja o processador, a memória ou a placa-mãe, como mencionado por @MattJenkins. Sugiro que você passe por meu post e especialmente este handly fluxograma (link contém mais informações):

Parece que a limpeza de poeira e a reinicialização do seu BIOS podem ajudar também ...

    
por 09.03.2011 / 00:41
3

Minha resposta habitual para qualquer problema relacionado ao hardware:

Faça o download do CD de inicialização do Hiren: link

Grave o ISO no disco e inicialize-o. Ele contém muitas ferramentas para diagnosticar problemas de hardware - teste de CPU, teste de memória, teste de placa-mãe.

Pelo som do seu problema, você pode ter os melhores resultados (ou pior?) usando uma das ferramentas que oferece um teste "Burn-In" (exersize todo o computador para enfatizar o teste).

    
por 09.03.2011 / 00:21