Meu Lenovo Thinkpad E430 está executando o Xubuntu 12.04 e está desde abril de 2013 (quando comprei o laptop). Nas últimas semanas, meu laptop está congelando de forma aparentemente aleatória. Comecei a perceber depois de instalar e inicializar uma versão mais antiga do kernel, mas mesmo depois de restaurar para o mais recente, o problema ainda ocorre, e isso pode ter sido apenas uma coincidência. Os sintomas são os seguintes:
- O computador fica completamente sem resposta, incluindo o cursor do mouse, et al., em intervalos aleatórios. Ele pode permanecer responsivo por dias a fio ou congelar várias vezes no espaço de uma hora.
- Ctrl + Alt + F1 (ou outros consoles) não funcionam ou, pelo menos, não posso alternar para eles.
O - SysReq + REISUB aparentemente não faz nada.
- Qualquer áudio em execução no momento fará um loop com um tamanho de amostra de cerca de um décimo de segundo.
- Syslog e Dmesg não contêm nada de nota.
- Depois de executar o memtest por mais de uma hora, não encontrou erros.
Possíveis soluções são difíceis de testar, pois podem falhar uma vez a cada poucos dias ou duas vezes no espaço de uma hora. Deixando soluções possíveis indistinguíveis da chance aleatória.
Não parece ser devido ao superaquecimento da CPU, uma vez que eu a tive congelado enquanto estava ocioso, e tive que permanecer perfeitamente responsivo ao jogar o FPS Xonótico multijogador.
Neste ponto, esgotamos minhas habilidades de solução de problemas e estou entrando em contato com a comunidade. Obrigado por qualquer ajuda que você possa fornecer.
Editar
Aqui está a saída de lspci
, no caso de o problema ser conhecido em determinados hardwares ou drivers:
00:00.0 Host bridge: Intel Corporation 3rd Gen Core processor DRAM Controller (rev 09)
00:02.0 VGA compatible controller: Intel Corporation 3rd Gen Core processor Graphics Controller (rev 09)
00:14.0 USB controller: Intel Corporation 7 Series/C210 Series Chipset Family USB xHCI Host Controller (rev 04)
00:16.0 Communication controller: Intel Corporation 7 Series/C210 Series Chipset Family MEI Controller #1 (rev 04)
00:1a.0 USB controller: Intel Corporation 7 Series/C210 Series Chipset Family USB Enhanced Host Controller #2 (rev 04)
00:1b.0 Audio device: Intel Corporation 7 Series/C210 Series Chipset Family High Definition Audio Controller (rev 04)
00:1c.0 PCI bridge: Intel Corporation 7 Series/C210 Series Chipset Family PCI Express Root Port 1 (rev c4)
00:1c.1 PCI bridge: Intel Corporation 7 Series/C210 Series Chipset Family PCI Express Root Port 2 (rev c4)
00:1c.2 PCI bridge: Intel Corporation 7 Series/C210 Series Chipset Family PCI Express Root Port 3 (rev c4)
00:1c.3 PCI bridge: Intel Corporation 7 Series/C210 Series Chipset Family PCI Express Root Port 4 (rev c4)
00:1d.0 USB controller: Intel Corporation 7 Series/C210 Series Chipset Family USB Enhanced Host Controller #1 (rev 04)
00:1f.0 ISA bridge: Intel Corporation HM77 Express Chipset LPC Controller (rev 04)
00:1f.2 SATA controller: Intel Corporation 7 Series Chipset Family 6-port SATA Controller [AHCI mode] (rev 04)
00:1f.3 SMBus: Intel Corporation 7 Series/C210 Series Chipset Family SMBus Controller (rev 04)
02:00.0 Unassigned class [ff00]: Realtek Semiconductor Co., Ltd. RTS5229 PCI Express Card Reader (rev 01)
03:00.0 Network controller: Intel Corporation Centrino Wireless-N 2230 (rev c4)
0c:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 07)
Atualização 2
Tenho notado que as falhas parecem mais prováveis no início da manhã depois que o laptop ficou inutilizado durante a noite. Além disso, as falhas são mais prováveis após uma reinicialização, embora eu só reinicie depois de uma falha, então pode ser que os usuários tenham caído em grupos ...
Atualização 3
Enviei o laptop de volta para a Lenovo para que a placa-mãe e a RAM fossem substituídas, supondo que o problema estivesse relacionado a uma dessas duas partes. Infelizmente, ao receber meu novo laptop "consertado", o problema persiste ... Estou começando a suspeitar do HDD, já que essa parte não foi substituída. Vou testar isso inicializando de uma unidade externa por alguns dias.
Atualização 4
Depois de passar mais de 24 horas iniciando a partir de um disco rígido externo sem uma única falha, decidi que é mais provável que seja o disco rígido interno (ou talvez o próprio barramento SATA). Vou arrancar durante 24 horas do disco rígido interno para ter a certeza de que o problema não foi corrigido devido a uma actualização.
Atualização 5
Demorou vários dias a correr na unidade interna para que esta falhasse ... Agora vou correr novamente para uma unidade externa durante uma semana ou mais.
Atualização 6
Bem, finalmente aconteceu. Ele finalmente caiu enquanto inicializado fora da unidade externa. Holmes nunca nos disse o que fazer quando as todas possibilidades foram eliminadas, incluindo o improvável.
Atualização 7
Até agora, venho operando sob a suposição de que é um problema de hardware. Neste ponto, vou tentar um ângulo diferente e assumir que pode ser um problema de software. Este artigo me fez pensar se poderia ser um problema no kernel: link
Por isso, atualizei para a versão 3.8 (3.8.0-37-genérica) do kernel do Raring para ver se ele resolve o problema. Como sempre, informarei em breve.
Atualização 8
Depois de correr por mais de 10 dias no novo kernel, eu ainda tenho que congelar meu laptop uma única vez. Neste ponto, é mais provável que a interação do kernel com o hardware seja a culpa. Eu estarei adicionando uma resposta definindo o que eu fiz para instalar o kernel mais novo para que outros que se deparam com este problema tenham uma solução.