BSODs de computador SOMENTE ao iniciar o Overwatch

1

Ok, então eu postei sobre isso nos fóruns do OW, embora pareça que ninguém se importa com isso. Então estou postando aqui apenas no caso de ser um problema de hardware e não um problema de overwatch, já que pareço ser um caso excelente.

Então, eu construí uma plataforma de jogos para atender todas as minhas necessidades de jogos, e tem por quase 2 anos e meio. Eu tenho jogado OW por aproximadamente o mesmo tempo e tudo estava bem até o recente patch OW. (e é por isso que eu acho que é um problema no seu fim) Agora, eu jogo muitos jogos que são mais graficamente intensivos do que o OW e eu nunca tive um acidente com eles, DOOM, Fallout 4 e Witcher 3 são apenas alguns exemplos.

O Crash ocorre SOMENTE quando eu lanço o OW, ele fica pendurado em uma tela preta e se eu tiver música no fundo, ele segura uma nota até que o computador BSODs e reinicie. O mais recente bsod disse algo ao longo das linhas de "relógio" e algo sobre o meu segundo núcleo?

Coisas que eu tentei; Memcheck, Un e Re instalaram o jogo, BIOS atualizado, gráficos atualizados e até mesmo janelas reinstaladas.

Não tenho certeza se isso está relacionado, mas recentemente recebi um novo Razer Ornata Keyboard, isso poderia estar afetando? Vou fazer uma tentativa e erro e atualizar este post. Atualizar; teclado desconectado, sem alteração.

Especificações na imagem anexada.

link

Minidump mais recente: link

Ajude um cara a sair? Espero que este problema não me faça parecer tão idiota quanto a minha última.

    
por surazaL 27.09.2018 / 05:16

2 respostas

1

O minidump diz que o código do bugcheck é WHEA_UNCORRECTABLE_ERROR.

WHEA = Arquitetura de erros de hardware do Windows. (isto é, você experimentou um problema de hardware). Os parâmetros de verificação de bug relatados no minidump são:

WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. 
Parameter 1 identifies the type of error source that reported the error. 
Parameter 2 holds the address of the WHEA_ERROR_RECORD structure that describes the error conditon.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
Arg2: fffffa80070778f8, Address of the WHEA_ERROR_RECORD structure.
Arg3: 0000000000000000, High order 32-bits of the MCi_STATUS value.
Arg4: 0000000000000000, Low order 32-bits of the MCi_STATUS value.

Em resumo, a CPU levantou uma exceção chamada "verificação de máquina". Esses são sempre fatais para o SO, tanto quanto eu sei. O minidump diz que você tem uma CPU AMD; o manual de arquitetura do processador AMD diz que o processador apresentará uma exceção de verificação de máquina nestas circunstâncias:

  1. Erros de cache associados à leitura e gravação de dados, sondagens, preenchimentos de linha de cache e write-backs de linha de cache. [note que estas são todas as coisas dentro do CPU. Não tem nada a ver com, e. o cache de arquivos do Windows. -jeh]
  2. Erros de paridade associados aos caches e TLBs. [também dentro da CPU -jeh]
  3. Erros de ECC associados aos caches e à DRAM. [Erros de ECC nos caches estão dentro da CPU. É muito improvável que você esteja executando a RAM ECC, portanto, assumirei que isso não se aplica. -jeh]
  4. Erros de barramento associados à leitura e gravação no barramento externo do processador. [como se diz - "bus externo", não dentro da CPU -jeh]

Podemos obter mais informações sobre isso formatando a estrutura WHEA_ERROR_RECORD, cujo endereço o Windows coloca convenientemente no argumento de verificação de bug 2.

1: kd> !errrec fffffa80'070778f8
===========================================================================
Common Platform Error Record @ fffffa80070778f8
---------------------------------------------------------------------------
Record Id     : 01d45625295c3b26
Severity      : Fatal (1)
Length        : 928
[...]
Error         : BUSLG_GENERIC_ERR_*_TIMEOUT_ERR (Proc 1 Bank 0)
  Status      : 0xb880000000020f0f

Então - nós tivemos um tempo limite em um ônibus. Ou seja, uma transação no ônibus foi iniciada, mas não foi concluída em breve. O "bus" foi provavelmente PCIexpress.

Dadas as circunstâncias que você descreve, isso aponta strongmente para a placa gráfica.

Mas primeiro eu tentaria trocar sua fonte de alimentação por uma melhor / mais poderosa, particularmente uma com mais corrente no barramento de 12V. As GPUs modernas são famintas por poder.

Aqui é uma página da Microsoft que entra em mais detalhes na interpretação desse tipo de despejo de memória (ou seja, código de verificação de erro 0x124).

Não há muito mais informação disponível no minidespejo. A única coisa que pode ser vista é a informação do tópico atual; Esse thread é dedicado a relatar erros WHEA, portanto não tem informações sobre o que estava acontecendo em outros threads, talvez em outros processadores lógicos, no momento, e o dump não contém nada disso. Normalmente eu tentaria por exemplo ! executando, pronto, etc., mas aqui o depurador apenas diz "impossível ler de fffff800030b9000". Isso é por causa das informações que estão faltando no minidump - o que é típico para erros da WHEA. Se você ativou o kernel ou os dumps automáticos e reproduziu o problema, é possível que o arquivo de dump maior tenha mais informações, mas parece que você tem um caminho claro a seguir sem isso, ou seja, trocas de hardware. Me desculpe por isso.

    
por 28.09.2018 / 11:07
0

Eu estou apenas supondo aqui, mas com base na quantidade de coisas que você tentou (mesmo reinstalando o Windows), estou tentado a dizer que sua GPU sofreu uma pequena falha de hardware localizada. Uma pequena parte da própria GPU, da placa ou da VRAM é defeituosa de tal forma que apenas sequências específicas de chamadas de desenho de gráficos fazem com que ela se manifeste. É totalmente possível que apenas um único jogo faça isso.

Eu tive um problema semelhante cerca de 10 anos atrás com um muito mais antigo Cartão Nvidia que era amplamente conhecido por sofrer efeitos de falha parcial com a idade; um MMO específico exibiria artefatos e depois travaria, mas outros MMOs e FPS rodariam bem.

Se a sua GPU tiver 2,5 anos de idade, ela tem idade suficiente para começar a deteriorar-se em algum tipo de falha inicial. Normalmente, isso é mais comum em laptops onde os chips consistentemente ficam mais quentes do que em desktops (por exemplo: MacBook Pros tiveram GPUs de curta duração por anos ), mas talvez você tenha tido azar.

Como uma generalização bruta, acredito que esse tipo de problema é muito raro em placas de vídeo modernas, mas isso não significa que não possa acontecer. A única razão pela qual ficou menos frequente é que, nas últimas gerações, a Nvidia e a AMD têm investido mais QA e testes de estresse em seus produtos do que antes para assegurar sua confiabilidade a longo prazo. Claro, se você usar um chip muito quente, eventualmente ele quebrará - é só uma questão de quando.

Em última análise, sem equipamentos muito especializados (provavelmente um microscópio eletrônico de varredura e / ou um microscópio de raios-x, bem como milhares de dólares em equipamentos adicionais de microeletrônica) não há como saber com certeza qual é o problema com sua GPU (se houver) e como / por que isso aconteceu.

Para um consumidor comum, infelizmente, a alternativa é simples, mas muitas vezes cara: quando você suspeita que uma peça está "ruim", substitua-a por um novo (ou pelo menos diferente, mas conhecido) dispositivo com funcionalidade equivalente .

Por exemplo, se você tinha uma GTX 970 que suspeita ser ruim, você poderia pegar emprestada a GTX 960 de um amigo (que ele testou e saber que funciona) e instalá-lo em seu sistema apenas para ver se ele funcionará. Se isso não funcionar, o problema é outra coisa. Se funcionar, a sua GTX 970 é ruim.

Repita esse processo para cada componente imaginável: placa-mãe, CPU, RAM, possivelmente até mesmo algo como uma placa WiFi.

Se você não tem amigos dispostos a emprestar peças de computador, talvez seja necessário comprá-los para fazer esses testes. Ou, se você conhece uma loja de conserto de computadores local amigável, eles podem solucioná-los com seu hardware disponível e podem cobrar apenas uma pequena taxa de diagnóstico (se houver), o que é muito mais barato do que comprar uma nova GPU. Você também pode se arriscar no mercado usado, se quiser.

Depois de identificar um hardware defeituoso, tudo o que você pode fazer é substituí-lo. Na maioria dos casos, não é econômico usar uma GPU quebrada e tentar consertá-la, porque o tempo necessário para que um profissional com equipamentos de última geração realmente encontre e corrija o problema excederá o valor da GPU - a menos que seja novo . E se for novo, você tem uma garantia e deve enviá-lo de volta ao fabricante para reparo ou substituição. As GPUs se desvalorizam muito rapidamente para que o reparo fora da garantia seja econômico, infelizmente.

Se a troca de hardware não corrigir o seu problema, então ainda pode ser um problema de software - mas considerando que você reinstalou completamente o Windows (e, supõe-se, Overwatch), minha aposta é que você acabará encontrando hardware defeituoso em vez de algo relacionado a software. Além disso, o tipo típico de erro de corrupção de dados não causa um BSOD.

Esse problema pode ser difícil de diagnosticar, quase impossível para a causa raiz e, provavelmente, caro para corrigir, se for o que eu acho que é. A maioria das GPUs tem uma garantia de 1 ou 2 anos, não de 2,5+ anos, então está quase sem garantia, a menos que você tenha um bom muito fabricante que se comprometa com uma garantia maior. Se você não estiver coberto pela garantia e determinar que o problema está no hardware da GPU, precisará comprar uma nova GPU.

    
por 27.09.2018 / 06:14