O novo computador não pode executar o Linux, mas roda o Windows sem problemas

3

Eu tenho um novo laptop para jogos que falha toda vez que eu executo o Linux. Se eu executo o Linux nativamente, ele congela completamente (incluindo o cursor do mouse) após um período aparentemente aleatório. Se eu rodar o Linux no VMWare Player no Windows 8.1, o Linux eventualmente trava da mesma maneira, mas o Windows também está travado e exibe uma Tela Azul do Morte (BSOD) após um pequeno atraso. A BSOD sempre diz MACHINE_CHECK_EXCEPTION e o log do BugCheck indica um código de 0x9c.

As variantes do Linux que tentei são:

  • Ubuntu MATE 15.10 de 64 bits
  • Ubuntu 15.04 de 64 bits
  • Ubuntu MATE 15.04 64 bits
  • Ubuntu MATE 14.04.2 de 64 bits
  • Ubuntu MATE 14.04.2 de 32 bits

Além desses traps mais ou menos aleatórios, o Linux roda bem - e eu pude usá-lo por muitas horas entre travamentos.

Eu tinha assumido que este é um problema de hardware, mas a dificuldade é que não consigo fazer o Windows travar, a menos que eu também esteja executando o Linux (em uma VM). Eu tentei lançar simultaneamente todos os aplicativos disponíveis (cerca de 30), enquanto reproduzia vídeos do YouTube, e também executando aplicativos de teste de estresse, como Prime95 . Também fiz alguns jogos com gráficos pesados.

Eu executei "Windows Memory Diagnostics Tool" e outros testes de memória sem problemas aparentes.

Um palpite é que o Linux está, de alguma forma, exercendo recursos de CPU que o Windows não usa, mas não está claro por que isso acionaria falhas de hardware aleatórias.

Como posso provar definitivamente que tenho hardware defeituoso (ou que não tenho)?

EDIT: Eu pareço ter alguma sorte consertar os problemas do Linux, desativando alguns recursos no BIOS. Eu não vi nenhum acidente desde que fiz isso. As alterações que fiz inicialmente (apenas com base na suposição):

  • Tecnologia de virtualização: desativado
  • Inicialização rápida: desativado
  • SpeedStep: desativado
  • Temporizador de latência do PCI: 64 relógios (32)

Baseado em testes subseqüentes de variações destes, aparentemente ambos VT e SS precisam ser desativados - mas com certeza, pelo menos SpeedStep. Isso torna mais fácil isolar as falhas como sendo baseadas em um defeito de hardware? ... Ou isso poderia ser um problema de software no Ubuntu / Linux?

Para tornar minha pergunta mais explícita: não estou realmente pedindo maneiras de resolver o problema, embora isso seja ótimo na teoria. O que eu realmente preciso é uma maneira de isolar e reproduzir esse problema no Windows sem também executar o Linux. Eu estou trabalhando a partir do pressuposto de que eu tenho uma unidade ruim - e eu só preciso de uma maneira de provar isso. Lembre-se de que a máquina está travando sempre que eu executo o Linux (exceto as alterações do BIOS mencionadas acima), então isso não pode ser resolvido simplesmente atualizando os drivers do Windows.

Resumindo: Sabendo que o Linux causa falhas, existe algum outro teste de estresse que eu possa executar, no Windows, que possa causar o mesmo tipo de falha? Alternativamente, este é um bug conhecido no Linux?

Note que o meu processador é o novo i7-5700HQ ( microarquitetura Broadwell ).

Observe também: não acredito que isso seja causado por superaquecimento grave. A máquina inclui um ventilador extra que pode ser ativado manualmente, e as falhas não parecem se correlacionar com cargas pesadas.

ATUALIZAÇÃO: Os problemas com a execução nativa do Linux foram resolvidos com a instalação de uma atualização do BIOS que ficou disponível alguns meses depois que eu postei a pergunta. Eu também estou agora executando o Ubuntu MATE 15.10, mas eu não acho que isso importe, uma vez que também falhou antes da atualização do BIOS. Eu acho que o longo e curto é que o sistema não era compatível com o Linux (ou vice-versa) como estavam no momento do lançamento.

Eu não voltei e testei novamente o problema da máquina virtual, já que realmente não preciso disso agora que posso executar o Linux nativamente - e também migrei do Windows 8.1 para o Windows 10, por isso não seria exatamente ser um teste de maçãs para maçãs mesmo assim.

    
por nobar 09.07.2015 / 03:52

3 respostas

1

De service.msicomputer.com:

Por que recebo um BSOD MACHINE_CHECK_EXCEPTION?

If you are experiencing a blue screen error when opening any Office 2016 applications, certain games, and virtual desktop Software, showing a "MACHINE_CHECK_EXCEPTION" or "CLOCK_WATCHDOG_TIMEOUT" BSOD's. This is caused by bug in the Microcode affecting only Broadwell CPU's (5th Gen) and it is resolved by updating the Microcode via a BIOS update from the versions listed below.

...

Last Update: September 30th, 2015

    
por 21.11.2015 / 20:36
1

Este é um problema de hardware, 9C os parâmetros têm diferentes significados dependendo do tipo de CPU que você tem. O mais comum é o resultado de superaquecimento, de hardware com falha - CPU, RAM, fonte de alimentação, etc. O envio de hardware além de seus recursos, como overclocking, também pode causar esse erro.

Verifique as configurações de hardware em sua BIOS, começando com a RAM. Assegure-se de que não haja superaquecimento nem overclocking.

Tente também desinstalar / não instalar programas que acompanham a sua placa-mãe.

Se isso não resolver o problema, tente mais algumas etapas:

  1. Verifique se a máquina está adequadamente refrigerada. Se houver alguma dúvida, abra a lateral da caixa do PC - se possível - (esteja ciente de quaisquer condições de garantia relevantes!) E aponte um ventilador de rede diretamente para a placa-mãe. Isso excluirá a maioria dos problemas de resfriamento (falta de).

  2. Atualize todos os drivers relacionados a hardware: vídeo, som, RAID (se houver), NIC ... qualquer coisa que interaja com uma peça de hardware. É uma boa prática executar os drivers mais recentes de qualquer maneira.

  3. Atualize o BIOS da placa-mãe de acordo com as instruções do fabricante. Seu site deve fornecer instruções detalhadas sobre o procedimento específico da marca e do modelo.

  4. Tentativa de testar os componentes de hardware que podem ser testados artificialmente. Os exemplos mais óbvios são a RAM e o (s) HDD (s). Para a RAM, use os diagnósticos de memória incorporados (execute o MDSCHED) ou o utilitário memtest86 de terceiros para executar muitas horas de testes. Para discos rígidos, verifique se o CHKDSK / R encontra algum problema na (s) unidade (s), principalmente em "setores defeituosos". RAM não confiável, em particular, é mortal no que diz respeito ao software, e qualquer outra coisa que não seja um resultado de teste de memória 100% claro é motivo de preocupação. Infelizmente, mesmo um resultado 100% claro dos utilitários de diagnósticos não garante que a RAM esteja livre de defeitos - apenas que nenhum deles foi encontrado durante o teste.

  5. Limpe e remova cuidadosamente qualquer poeira do interior da máquina. Recoloque todos os conectores e módulos de memória. Use uma lata de ar comprimido para limpar os soquetes DIMM de RAM o máximo possível.

  6. Se tudo mais falhar, comece removendo itens de hardware um a um na esperança de que o culpado seja algo não essencial que possa ser removido. Obviamente, esse tipo de teste é muito mais fácil se você tiver acesso a componentes equivalentes para executar swaps. No seu caso, a RAM e o HDD provavelmente podem ser trocados.

por 09.07.2015 / 05:08
1

adicione libata.force = noncq ao parâmetro de inicialização do grub. Funciona como um encanto. Meu problema é que os drivers de vídeo não estão sendo executados em uma VM, mas sim com uma dupla inicialização real.

    
por 02.11.2015 / 22:28