Bug de gráficos muito resiliente

2

Eu passei o mês passado trabalhando usando uma caixa que parece ser amaldiçoada.

História de fundo: Desenvolvemos um software muito gráfico, que usa muitos OpenCL, CUDA e assim por diante. Por isso, colocamos altas demandas em nosso hardware gráfico. Isso também significa que não posso usar os drivers Nouveau, já que não podemos executar o nosso software com ele.

Quando comecei neste trabalho, tinha uma caixa de 12.10 com um AMD FirePro V5900. Depois de deixar o computador ligado por algumas semanas, esse problema começou a aparecer; e logo foi seguido por uma série de outras questões. Esses outros problemas (tela bruxuleante, janelas pretas e mais) estão fora do escopo da questão, já que eles foram documentados em outro lugar, mas pelo que eu posso dizer, meu problema é único - várias vezes eu encontrei fotos do que parece para ser outras instâncias da questão, mas um estudo mais detalhado (carregar a página em outro computador) indica que as falhas estão do meu lado. O que eu vejo, seja o que for que eu esteja fazendo no computador, é isso:

Esses patches (com furos altos de 2 pixels) piscam a cada redesenho, muitos deles mudando de posição. Eu passei um mês trabalhando com TI tentando corrigir o problema e até agora tentamos (em ordem):

  • Atualizando para 13.10
  • Inicializando no kernel antigo
  • Mudando para o Gnome 3 (foi pior)
  • Alternando para a metaclidade do Gnome (igual à unidade)
  • Limpando a unidade e instalando 14.04
  • Inicializando no kernel antigo
  • Trocando a placa por uma placa NVIDIA Quadro 5000, reenviando a unidade e instalando a 14.04 novamente para uma boa medida
  • Tentei monitor e cabo diferentes
  • Arrancando todas as entranhas, nova mobo, nova RAM (um memtest de fim de semana apareceu bem, mas não estávamos dando chances), tudo exceto o caso novo; novamente rewiping drive e reinstalar Trusty.
  • Teste com um novo e belo monitor de alta resolução

Nada funcionou - todas as vezes, ficaria bom e fresco, mas seria inútil, então tentaríamos uma chave de driver, mas depois de mudar para qualquer outro motorista, a loucura retorna . As partes são todas novas (agora mesmo assim), e nada é, ou nunca foi, overclockado.

E agora? Em poucas horas, estamos limpando meu disco novamente, desta vez para tentar Precise. Honestamente, já perdi bastante produtividade, por isso, se isso não funcionar, mudo para Mint ou Arch ou Windows. No momento, prefiro apenas documentar um bug estranho e talvez obter alguma ajuda para criar um relatório de bug (e arquivá-lo no lugar certo).

No entanto, eu posso ter apenas estragado de maneira sutil com a configuração do meu driver. Como acho muito provável, decidi que seria melhor perguntar aqui. Então, alguma idéia?

    
por Filipq 18.06.2014 / 20:43

2 respostas

2

Ok, vendo você descartou quase tudo,

E quanto à strong interferência eletromagnética perto da máquina?
Possivelmente também perto dos cabos de energia, caso tenham emitido como conexão incompleta para aterrar localmente?

Você diz que "tudo, exceto o caso, é novo" - que poderia ser uma sugestão nessa direção, já que é a principal função do caso manter esses problemas de lado.

O outro componente relevante para o manuseio de interferência eletromagnética é a fonte de alimentação. Na verdade, gasta muita complexidade em fornecer corrente bem filtrada, em oposição a apenas corrente strong.

    
por Volker Siegel 18.06.2014 / 21:32
1

Nota: notei que esta solução já estava descartada para o caso específico em questão (RAM foi substituída), mas mantenho essa resposta supondo que ela possa ser útil para os leitores que trabalham em questões semelhantes ]

Para mim, isso se parece muito com um problema de memória, assumindo que coisas como conectores soltos já foram verificadas.
Agora, você descartou a placa gráfica alterando-a, certo?

Isso deixaria a memória principal da máquina. Você poderia trocar ou pelo menos testá-lo?

Sua nota sobre "falhas parecendo presas a imagens" com certeza soa ainda mais como um problema de memória.

    
por Volker Siegel 18.06.2014 / 21:23