O minidump diz que o código do bugcheck é WHEA_UNCORRECTABLE_ERROR.
WHEA = Arquitetura de erros de hardware do Windows. (isto é, você experimentou um problema de hardware). Os parâmetros de verificação de bug relatados no minidump são:
WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred.
Parameter 1 identifies the type of error source that reported the error.
Parameter 2 holds the address of the WHEA_ERROR_RECORD structure that describes the error conditon.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
Arg2: fffffa80070778f8, Address of the WHEA_ERROR_RECORD structure.
Arg3: 0000000000000000, High order 32-bits of the MCi_STATUS value.
Arg4: 0000000000000000, Low order 32-bits of the MCi_STATUS value.
Em resumo, a CPU levantou uma exceção chamada "verificação de máquina". Esses são sempre fatais para o SO, tanto quanto eu sei. O minidump diz que você tem uma CPU AMD; o manual de arquitetura do processador AMD diz que o processador apresentará uma exceção de verificação de máquina nestas circunstâncias:
- Erros de cache associados à leitura e gravação de dados, sondagens, preenchimentos de linha de cache e write-backs de linha de cache. [note que estas são todas as coisas dentro do CPU. Não tem nada a ver com, e. o cache de arquivos do Windows. -jeh]
- Erros de paridade associados aos caches e TLBs. [também dentro da CPU -jeh]
- Erros de ECC associados aos caches e à DRAM. [Erros de ECC nos caches estão dentro da CPU. É muito improvável que você esteja executando a RAM ECC, portanto, assumirei que isso não se aplica. -jeh]
- Erros de barramento associados à leitura e gravação no barramento externo do processador. [como se diz - "bus externo", não dentro da CPU -jeh]
Podemos obter mais informações sobre isso formatando a estrutura WHEA_ERROR_RECORD, cujo endereço o Windows coloca convenientemente no argumento de verificação de bug 2.
1: kd> !errrec fffffa80'070778f8
===========================================================================
Common Platform Error Record @ fffffa80070778f8
---------------------------------------------------------------------------
Record Id : 01d45625295c3b26
Severity : Fatal (1)
Length : 928
[...]
Error : BUSLG_GENERIC_ERR_*_TIMEOUT_ERR (Proc 1 Bank 0)
Status : 0xb880000000020f0f
Então - nós tivemos um tempo limite em um ônibus. Ou seja, uma transação no ônibus foi iniciada, mas não foi concluída em breve. O "bus" foi provavelmente PCIexpress.
Dadas as circunstâncias que você descreve, isso aponta strongmente para a placa gráfica.
Mas primeiro eu tentaria trocar sua fonte de alimentação por uma melhor / mais poderosa, particularmente uma com mais corrente no barramento de 12V. As GPUs modernas são famintas por poder.
Aqui é uma página da Microsoft que entra em mais detalhes na interpretação desse tipo de despejo de memória (ou seja, código de verificação de erro 0x124).
Não há muito mais informação disponível no minidespejo. A única coisa que pode ser vista é a informação do tópico atual; Esse thread é dedicado a relatar erros WHEA, portanto não tem informações sobre o que estava acontecendo em outros threads, talvez em outros processadores lógicos, no momento, e o dump não contém nada disso. Normalmente eu tentaria por exemplo ! executando, pronto, etc., mas aqui o depurador apenas diz "impossível ler de fffff800030b9000". Isso é por causa das informações que estão faltando no minidump - o que é típico para erros da WHEA. Se você ativou o kernel ou os dumps automáticos e reproduziu o problema, é possível que o arquivo de dump maior tenha mais informações, mas parece que você tem um caminho claro a seguir sem isso, ou seja, trocas de hardware. Me desculpe por isso.