Como faço para solucionar problemas de congelamentos aleatórios, em que o sistema não aceita nenhuma entrada?
Eu tenho um computador que costumava executar o Ubuntu há alguns anos sem problemas (não sei se algum hardware foi alterado). Recentemente, não importa qual distribuição Linux eu instale, ele irá congelar aleatoriamente até o ponto em que o cursor está congelado e não responde a nenhuma entrada de teclado, incluindo alt + sysrq (quando o sistema não está congelado, posso alt + sysrq REISUB e irá reiniciar). Não há respostas em O que devo fazer quando o Ubuntu congelar? parecem "funcionar" nesta situação.
Acionei o congelamento com os seguintes sistemas: Ubuntu 12.04, Ubuntu 14.04, Ubuntu 14.10, Ubuntu 15.04, Ubuntu 15.10, bem como Fedora 22 e 23 (todas as versões de 64 bits).
Isso acontece com o XFCE, Unity e até mesmo o Gnome, isso acontece com novos e diferentes versões do driver nvidia proprietário.
Pode congelar, mesmo durante a instalação ou durante uma sessão ao vivo. Às vezes, o sistema funcionará por 5 minutos antes do congelamento e, às vezes, duas horas.
O mesmo hardware pode executar um sistema operacional Windows por dias sem problemas.
Eu tentei configurar o Kernel Crash Dump, mas ele não parece ser acionado quando o sistema congela. Não há entradas no syslog ou no kern.log que parecem ter sido gravadas antes do congelamento. Em alguns trechos, a última entrada no syslog ou no kern.log foi 30 minutos antes.
Atualização:
Eu desconectei uma placa de rede sem fio, assim como uma webcam USB, deixarei a máquina funcionar durante a noite para ver se uma delas está causando isso. Vai atualizar com os resultados.
Atualização 2:
Ele congelou novamente. Estou literalmente sem ideias. Qualquer sugestão é bem vinda.
Update3:
Algumas especificações de hardware que podem ser relevantes:
Placa-mãe: Sabertooth 990FX R2.0
CPU: AMD FX-8350 Black Edition
GPU: GeForce GTX 660
Update3:
Atualizei recentemente o BIOS da Sabertooth 990FX R2.0 para a versão 2501 (a última versão atualmente disponível), sem qualquer sorte.
Atualização 4:
Eu corri um memtest por 9 horas, vários passes e nenhum erro. Existem dois DIMMS colocados nos slots 2 e 4 da placa-mãe. Agora tentei remover o do slot 4 e verei se consigo reproduzir o congelamento. Vai trocá-los depois.
Atualização 5:
Correu por muitas horas sem congelar até agora, estou achando difícil acreditar em mim mesmo. Isso pode ser resolvido, mas não entendo o porquê. Eu acho que vou tentar dar alguns dias para ter certeza.
Atualização 6:
Não houve congelamentos, e devo concluir que eles foram causados por memória defeituosa. Como o memtest não mostrou nenhum erro, é provável que eu nunca tenha descoberto o que estava errado se não tivesse começado a desconectar partes "aleatórias". Esta é a melhor abordagem realmente? Se alguém puder escrever uma maneira mais sistemática de ir em algo como isto, talvez com a solução de problemas do Ubuntu, eu recompensarei a recompensa.