rastrear a causa do erro da tela azul (código 124)

0

Eu tenho tido problemas com um Laptop de triagem azul (BCCode 124), e tenho tentado rastrear o que está causando isso. (É bluescreened aleatoriamente após 5-30 minutos de execução no win7). Funcionou em modo de segurança. Tentei reinstalar o Windows, o que não funcionou, então tentei instalar vários sistemas Linux que também não funcionavam.

A única coisa que está funcionando agora é a versão mágica do último CD de boot (é uma distro linux de reparo que roda ao vivo a partir de um ram)

Eu tive a ideia de executar vários testes de estabilidade para tentar isolar o (s) componente (s) defeituoso (s), e eu queria alguma informação sobre os meus resultados.

Eu fiz testes de estresse de cpu diferentes para tempos diferentes. Não tem problema (temeratura ~ 60 ° C às vezes chega aos 65)

Eu corri o memtest sem erros muitas vezes.

Eu também fiz uma checagem de GPU que está inclusa na última distribuição de cd de boot - parted magic distro - sem problemas.

Eu também verifiquei o disco rígido com diferentes ferramentas incluídas na magia parted - não há problema também.

Todo sistema Linux que eu tento instalar falha quando eu tento instalá-lo. (Ele congela sem erro (raramente acontece) ou eu recebo algo assim pouco depois de eu dizer para instalar (tentei cerca de 20 distros diferentes): [*] 3 fotos na caixa de depósito

Tentando isntall o windows 7 apenas fornece uma tela genérica "houve um problema" / "ocorreu um erro" sem mais informações.

O laptop é um Lenovo B570. Aqui estão as especificações detalhadas do sistema (o ram é um kingston de 4 GB agora) [*] o arquivo hardinfo na caixa de depósito

Eu tenho 3 crashdumps do Windows que eu não consigo abrir. (visual studio diz que não pode abrir arquivos antigos de crashdump) [*] 3 dumps na caixa de depósito

Você pode me ajudar a rastrear a causa?

Editar: não estou autorizado a postar mais de 2 links aqui, então aqui a pasta dropbox com todas as coisas que eu mencionei:

[*] link

    
por t0b4cc0 13.01.2016 / 16:30

3 respostas

2

Você recebe um erro GCACHEL2_EVICT_ERR (erro de cache de nível 2 durante um evento de despejo de cache).

0: kd> !errrec fffffa800966a038
===============================================================================
Common Platform Error Record @ fffffa800966a038
-------------------------------------------------------------------------------
Record Id     : 01d0f21d97143e24
Severity      : Fatal (1)
Length        : 873
Creator       : Microsoft
Notify Type   : Machine Check Exception
Timestamp     : 9/18/2015 14:25:03 (UTC)
Flags         : 0x00000000

===============================================================================
Section 0     : Memory
-------------------------------------------------------------------------------
Descriptor    @ fffffa800966a0b8
Section       @ fffffa800966a190
Offset        : 344
Length        : 73
Flags         : 0x00000001 Primary
Severity      : Fatal

Physical Addr.: 0x000000023c175dc0

===============================================================================
Section 1     : Processor Generic
-------------------------------------------------------------------------------
Descriptor    @ fffffa800966a100
Section       @ fffffa800966a1d9
Offset        : 417
Length        : 192
Flags         : 0x00000000
Severity      : Fatal

Proc. Type    : x86/x64
Instr. Set    : x64
Error Type    : Cache error
Operation     : Generic
Flags         : 0x00
Level         : 2
CPU Version   : 0x00000000000206a7
Processor ID  : 0x0000000000000000

===============================================================================
Section 2     : x86/x64 MCA
-------------------------------------------------------------------------------
Descriptor    @ fffffa800966a148
Section       @ fffffa800966a299
Offset        : 609
Length        : 264
Flags         : 0x00000000
Severity      : Fatal

Error         : GCACHEL2_EVICT_ERR (Proc 0 Bank 5)
  Status      : 0xfe2000000001117a
  Address     : 0x000000023c175dc0
  Misc.       : 0x000000372e004086

Procure por uma atualização do BIOS, se isso não resolver o problema, o seu cache L2 estará danificado e você terá que substituir a CPU.

    
por 13.01.2016 / 18:59
1

da Microsoft (ênfase adicionada) :

The WHEA_UNCORRECTABLE_ERROR bug check has a value of 0x00000124. This bug check indicates that a fatal hardware error has occurred.

Isso, em combinação com o fato de que você não pode executar ou instalar a maioria dos outros SOs que você está tentando, me diz que você definitivamente tem algum tipo de erro de hardware.

As probabilidades de ser um "erro de CPU" são pequenas, já que as CPUs são um dos componentes menos prováveis de ter mau funcionamento; É mais provável que um problema na placa-mãe esteja causando os erros relacionados à CPU - mas é praticamente impossível dizer com certeza sem substituir e testar componentes.

Independentemente de onde você começar, você deve começar a solucionar problemas no hardware, um componente por vez. por exemplo: Drives, RAM, PSU, placa-mãe, CPU, em (basicamente) essa ordem.

    
por 12.01.2016 / 15:45
0

Eu só vim aqui para dizer que ive conseguiu fazer o linux rodar com o startparameter maxcores = 1 (é uma CPU de 2 núcleos).

Obrigado por ajudar a todos, você me salvou 200 dólares!

Então, se alguém tiver este erro e não se sentir como reparar hardware / comprar novo, obtenha o linux nele. Instale com esse parâmetro e adicione este parâmetro aos parâmetros padrão do grub.

Seria interessante testar a cpu com o cache L2 desabilitado (e com o outro núcleo habilitado novamente), mas isso é um nível totalmente diferente.

    
por 16.01.2016 / 23:48