Causa provável de BSODs associados aos avisos do Desktop Window Manager

1

Meu computador principal passa por um teste de BSOD ( bug 124 ) aproximadamente uma vez por dia e tem feito isso por vários meses. Essas BSODs parecem estar relacionadas aos avisos 500 e 501 no log de eventos do Windows. Ambos os tipos de mensagem dizem "O Gerenciador de Janelas da Área de Trabalho está passando por contenção de recursos pesados". 500 adiciona "A capacidade de resposta do DWM foi degradada". 501 adiciona "Os recursos do subsistema gráfico são superutilizados. Uma degradação consistente na taxa de quadros para o DW".

Depois de verificar se o driver gráfico estava atualizado, substituí a placa de vídeo AMD por uma placa Nvidia de outra máquina. Embora a substituição da placa gráfica seja cara, achei que era a suspeita mais provável, e é mais fácil do que substituir a placa-mãe ou a fonte de alimentação. Mas isso não fez diferença para o problema. Ainda os mesmos avisos 500/501 e um BSOD diário.

Nenhum evento de hardware no log de eventos. Nenhum erro ou aviso no gerenciador de dispositivos. Nada mais incomum que eu pudesse encontrar. Então eu tenho 3 perguntas:

  • Alguma outra técnica investigativa disponível (curta de um voltímetro)?
  • Qualquer alternativa para substituir a placa-mãe e / ou a fonte de alimentação?
  • Quaisquer outras causas prováveis para o BSOD?

EDIT 1: Eu executei o diagnóstico interno de memória do Windows duas vezes e obtive um resultado limpo nas duas vezes. Mas quando eu corri o teste de tortura Prime95 (misturado, muitos testes de RAM) duas vezes, ele causou o mesmo BSOD ambas as vezes em 30 segundos. Quando eu fiz o teste Prime95 de tortura (FFTs pequenas, a RAM não testou muito), funcionou bem por 10 minutos, embora a temperatura em alguns núcleos tenha atingido 91C no impulso total (33C em marcha lenta, temperatura ambiente 22C ). Então talvez um hardware de memória ou problema de voltagem.

EDIT 2: Eu mudei a configuração de tensão de memória para que ela possa chegar a 1,6 (a partir do padrão de 1,5). O teste de tortura misturado Prime95 agora funciona por 10 minutos sem BSOD, embora 3 dos 4 núcleos atinjam a terrível temperatura de 98C! Vou assistir a 500/501 eventos nos próximos dias.

EDIT 3: Não consigo desabilitar o núcleo com o desonesto cache L2, pois o BIOS não permite desativar núcleos específicos. Mas mudar para um perfil com tensão de memória aumentou de 1,5 para 1,6 e o overclock reduzido de 4,6 para 4,2 GhZ parece ter eliminado as BSODs.

Detalhes do sistema

  • Placa-mãe: Asus P8Z68-V LE
  • Gráficos: Nvidia GTX 770 2 Gb
  • Potência: Corsair 600W
  • CPU: Intel i7 2600K 3.4 GhZ (sob demanda para 4.6 Ghz)
  • Arrefecimento: Noctua NH-D14
  • Memória: 16 Gb PC3-10666 1333 MHz DDR3
  • SO: Windows 7 Pro com Aero desligado
  • Todos os drivers de dispositivo estão atualizados. SO totalmente corrigido.
  • A máquina raramente é muito difícil - talvez uma vez por mês.
por RoadWarrior 01.02.2014 / 18:16

1 resposta

4

Veja a saída de !analyze-v e !errrec para o seu arquivo de despejo.

Eu não sou tão experiente com a depuração do kernel, mas parece que GCACHEL2_ERR_ERR (Proc 0 Bank 8) é um problema com o cache L2 em um dos núcleos físicos do i7.

Por que isso acontece ... quem sabe:)

0: kd> !analyze -v
*******************************************************************************
*                                                                             *
*                        Bugcheck Analysis                                    *
*                                                                             *
*******************************************************************************

WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. Parameter 1 identifies the type of error
source that reported the error. Parameter 2 holds the address of the
WHEA_ERROR_RECORD structure that describes the error conditon.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
Arg2: fffffa800de4e028, Address of the WHEA_ERROR_RECORD structure.
Arg3: 00000000be200000, High order 32-bits of the MCi_STATUS value.
Arg4: 000000000005110a, Low order 32-bits of the MCi_STATUS value.

Debugging Details:
------------------


BUGCHECK_STR:  0x124_GenuineIntel
CUSTOMER_CRASH_COUNT:  1
DEFAULT_BUCKET_ID:  WIN7_DRIVER_FAULT
PROCESS_NAME:  System
CURRENT_IRQL:  f
STACK_TEXT:  
nt!KeBugCheckEx


STACK_COMMAND:  kb
FOLLOWUP_NAME:  MachineOwner
MODULE_NAME: GenuineIntel
IMAGE_NAME:  GenuineIntel
DEBUG_FLR_IMAGE_TIMESTAMP:  0
FAILURE_BUCKET_ID:  X64_0x124_GenuineIntel_PROCESSOR_CACHE
BUCKET_ID:  X64_0x124_GenuineIntel_PROCESSOR_CACHE
Followup: MachineOwner

0: kd> !errrec fffffa800de4e028
===============================================================================
Common Platform Error Record @ fffffa800de4e028
-------------------------------------------------------------------------------
Record Id     : 01cf07525f60f483
Severity      : Fatal (1)
Length        : 928
Creator       : Microsoft
Notify Type   : Machine Check Exception
Timestamp     : 1/2/2014 20:45:39 (UTC)
Flags         : 0x00000000

===============================================================================
Section 0     : Processor Generic
-------------------------------------------------------------------------------
Descriptor    @ fffffa800de4e0a8
Section       @ fffffa800de4e180
Offset        : 344
Length        : 192
Flags         : 0x00000001 Primary
Severity      : Fatal

Proc. Type    : x86/x64
Instr. Set    : x64
Error Type    : Cache error
Operation     : Generic
Flags         : 0x00
Level         : 2
CPU Version   : 0x00000000000206a7
Processor ID  : 0x0000000000000000

===============================================================================
Section 1     : x86/x64 Processor Specific
-------------------------------------------------------------------------------
Descriptor    @ fffffa800de4e0f0
Section       @ fffffa800de4e240
Offset        : 536
Length        : 128
Flags         : 0x00000000
Severity      : Fatal

Local APIC Id : 0x0000000000000000
CPU Id        : a7 06 02 00 00 08 10 00 - bf e3 9a 1f ff fb eb bf
                00 00 00 00 00 00 00 00 - 00 00 00 00 00 00 00 00
                00 00 00 00 00 00 00 00 - 00 00 00 00 00 00 00 00

Proc. Info 0  @ fffffa800de4e240

===============================================================================
Section 2     : x86/x64 MCA
-------------------------------------------------------------------------------
Descriptor    @ fffffa800de4e138
Section       @ fffffa800de4e2c0
Offset        : 664
Length        : 264
Flags         : 0x00000000
Severity      : Fatal

Error         : GCACHEL2_ERR_ERR (Proc 0 Bank 8)
  Status      : 0xbe2000000005110a
  Address     : 0x0000000132de9a40
  Misc.       : 0x000000d080034086
    
por 02.02.2014 / 04:01