O que pode fazer com que as placas gráficas PCIe falhem aleatoriamente durante a inicialização?

1

Eu tenho um sistema que está me enlouquecendo, e espero que alguém aqui no StackExchange possa apontar algo que estou fazendo errado.

O computador é feito em casa e consiste em:

  • CPU: Intel Core i7 4790K (estoque @ 4GHz)
  • MB: Gigabyte GA-Z97X-jogos G1 WIFI-BK
  • RAM: G.skill Trident X F3-2400C10Q-32GTX (kit correspondente de 8 GB x 4)
  • GFX: 2x Gigabyte GV-N980G1 JOGO-4GD GTX 980 (SLI)
  • PWR: Corsair HX1000i
  • SO: Windows 8.1 Pro

Toda vez que eu ligo a máquina, é um jogo a dinheiro, quer as placas gráficas entrem ou não on-line. Se tiver sorte, as cartas ligam e recebo um sinal de exibição (via DP-out) no meu monitor principal. Quando isso acontece, a máquina parece operar corretamente até que seja desligada, embora seu desempenho esteja bem abaixo do que deveria ser para o hardware (pontuação de 3DMark Fire Strike Extreme de aproximadamente 8000, comparada à lista 10100 da Futuremark para um sistema de referência com CPU e placas gráficas).

Se eu tiver azar, a máquina inicializa e o vídeo fica on-line com os gráficos integrados da Intel (que eu direcionei para um segundo monitor). O gerenciador de dispositivos não detecta os cartões NVIDIA. Eles não aparecem como "dispositivo desconhecido", eles não aparecem como "inicialização com falha" - eles estão faltando completamente.

Seguindo o procedimento usual para esses tipos de situações, eu removi e reposicionei a placa-mãe, placas, fonte de alimentação e todas as conexões de energia. Verifiquei se não há condutores soltos que possam estar provocando curtos. Verifiquei as temperaturas da CPU e da GPU para ter certeza de que elas estão funcionando bem dentro dos limites térmicos sob carga (aproximadamente 65C para GPUs e 55C para CPU).

Estou completamente perplexo com isso. Qualquer sugestão (não importa quão óbvia) seria muito apreciada.

Atualizado:

A pedido do Journeyman Geek nos comentários, testei a máquina com cada placa gráfica instalada individualmente. Isso parece resolver o problema: eu inicializei o sistema cerca de uma dúzia de vezes com cada placa e ela não conseguiu aparecer ainda. Além disso, o 3DMark confirma que as placas estão executando individualmente em média para essa configuração de hardware com uma única GPU.

Portanto, este problema parece estar relacionado especificamente ao uso das duas placas em uma configuração SLI.

Atualmente estou fazendo mais alguns testes com as duas placas em uma configuração de slot PCIe diferente (1 & 2 em vez de 1 & 3) para ver se talvez eu tenha um slot ruim na placa.

Atualização 2:

A configuração do Slot 1 & 2 funcionou bem e colocou o 9600 no 3DMark Fire Strike Extreme. (Baixa, mas isso é esperado com duas placas de largura dupla lado a lado; elas vão superaquecer e se estrangular umas com as outras sem um sistema de troca de fase ou líquido para serviço pesado.)

Depois de executar alguns testes nesta configuração, coloco os cartões de volta em 1 & 3. Agora tudo está funcionando corretamente em mais uma dúzia de botas. Sistema agora bancos 10800 em FSE.

Eu não posso para a vida de mim descobrir o que é possivelmente diferente desta vez, em oposição à meia dúzia de vezes que eu recoloquei as cartas antes. Continuaremos executando essa configuração por alguns dias e encerraremos minha pergunta como "causada por duendes" se não conseguir reproduzir a condição de erro novamente.

    
por Dan Story 05.06.2015 / 04:45

1 resposta

0

Você definitivamente tem um computador de jogos pesado, mas eu ainda suspeito da fonte de alimentação primeiro - confirme se a sua fonte de alimentação atende ou excede a voltagem recomendada nos trilhos de 12V e compare com o que as especificações da 980 devem atender.

Você mencionou o Windows 8.1, então eu também diria que olhe para seus logs e veja se você pode obter mais informações sobre o motivo pelo qual seus drivers não estão aparecendo.

Eu me deparei com esse problema com duas 980 em janeiro, mas não me preocupei mais com as investigações porque atualizei para uma placa-mãe ASUS e uma fonte de alimentação mais antiga da Thermaltake e o problema desapareceu.

    
por 05.06.2015 / 05:18