Lenovo Thinkpad E430 A execução do Linux congela aparentemente aleatoriamente

2

Meu Lenovo Thinkpad E430 está executando o Xubuntu 12.04 e está desde abril de 2013 (quando comprei o laptop). Nas últimas semanas, meu laptop está congelando de forma aparentemente aleatória. Comecei a perceber depois de instalar e inicializar uma versão mais antiga do kernel, mas mesmo depois de restaurar para o mais recente, o problema ainda ocorre, e isso pode ter sido apenas uma coincidência. Os sintomas são os seguintes:

  • O computador fica completamente sem resposta, incluindo o cursor do mouse, et al., em intervalos aleatórios. Ele pode permanecer responsivo por dias a fio ou congelar várias vezes no espaço de uma hora.
  • Ctrl + Alt + F1 (ou outros consoles) não funcionam ou, pelo menos, não posso alternar para eles.
  • O
  • SysReq + REISUB aparentemente não faz nada.
  • Qualquer áudio em execução no momento fará um loop com um tamanho de amostra de cerca de um décimo de segundo.
  • Syslog e Dmesg não contêm nada de nota.
  • Depois de executar o memtest por mais de uma hora, não encontrou erros.

Possíveis soluções são difíceis de testar, pois podem falhar uma vez a cada poucos dias ou duas vezes no espaço de uma hora. Deixando soluções possíveis indistinguíveis da chance aleatória.

Não parece ser devido ao superaquecimento da CPU, uma vez que eu a tive congelado enquanto estava ocioso, e tive que permanecer perfeitamente responsivo ao jogar o FPS Xonótico multijogador.

Neste ponto, esgotamos minhas habilidades de solução de problemas e estou entrando em contato com a comunidade. Obrigado por qualquer ajuda que você possa fornecer.

Editar

Aqui está a saída de lspci , no caso de o problema ser conhecido em determinados hardwares ou drivers:

00:00.0 Host bridge: Intel Corporation 3rd Gen Core processor DRAM Controller (rev 09)
00:02.0 VGA compatible controller: Intel Corporation 3rd Gen Core processor Graphics Controller (rev 09)
00:14.0 USB controller: Intel Corporation 7 Series/C210 Series Chipset Family USB xHCI Host Controller (rev 04)
00:16.0 Communication controller: Intel Corporation 7 Series/C210 Series Chipset Family MEI Controller #1 (rev 04)
00:1a.0 USB controller: Intel Corporation 7 Series/C210 Series Chipset Family USB Enhanced Host Controller #2 (rev 04)
00:1b.0 Audio device: Intel Corporation 7 Series/C210 Series Chipset Family High Definition Audio Controller (rev 04)
00:1c.0 PCI bridge: Intel Corporation 7 Series/C210 Series Chipset Family PCI Express Root Port 1 (rev c4)
00:1c.1 PCI bridge: Intel Corporation 7 Series/C210 Series Chipset Family PCI Express Root Port 2 (rev c4)
00:1c.2 PCI bridge: Intel Corporation 7 Series/C210 Series Chipset Family PCI Express Root Port 3 (rev c4)
00:1c.3 PCI bridge: Intel Corporation 7 Series/C210 Series Chipset Family PCI Express Root Port 4 (rev c4)
00:1d.0 USB controller: Intel Corporation 7 Series/C210 Series Chipset Family USB Enhanced Host Controller #1 (rev 04)
00:1f.0 ISA bridge: Intel Corporation HM77 Express Chipset LPC Controller (rev 04)
00:1f.2 SATA controller: Intel Corporation 7 Series Chipset Family 6-port SATA Controller [AHCI mode] (rev 04)
00:1f.3 SMBus: Intel Corporation 7 Series/C210 Series Chipset Family SMBus Controller (rev 04)
02:00.0 Unassigned class [ff00]: Realtek Semiconductor Co., Ltd. RTS5229 PCI Express Card Reader (rev 01)
03:00.0 Network controller: Intel Corporation Centrino Wireless-N 2230 (rev c4)
0c:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 07)

Atualização 2

Tenho notado que as falhas parecem mais prováveis no início da manhã depois que o laptop ficou inutilizado durante a noite. Além disso, as falhas são mais prováveis após uma reinicialização, embora eu só reinicie depois de uma falha, então pode ser que os usuários tenham caído em grupos ...

Atualização 3

Enviei o laptop de volta para a Lenovo para que a placa-mãe e a RAM fossem substituídas, supondo que o problema estivesse relacionado a uma dessas duas partes. Infelizmente, ao receber meu novo laptop "consertado", o problema persiste ... Estou começando a suspeitar do HDD, já que essa parte não foi substituída. Vou testar isso inicializando de uma unidade externa por alguns dias.

Atualização 4

Depois de passar mais de 24 horas iniciando a partir de um disco rígido externo sem uma única falha, decidi que é mais provável que seja o disco rígido interno (ou talvez o próprio barramento SATA). Vou arrancar durante 24 horas do disco rígido interno para ter a certeza de que o problema não foi corrigido devido a uma actualização.

Atualização 5

Demorou vários dias a correr na unidade interna para que esta falhasse ... Agora vou correr novamente para uma unidade externa durante uma semana ou mais.

Atualização 6

Bem, finalmente aconteceu. Ele finalmente caiu enquanto inicializado fora da unidade externa. Holmes nunca nos disse o que fazer quando as todas possibilidades foram eliminadas, incluindo o improvável.

Atualização 7

Até agora, venho operando sob a suposição de que é um problema de hardware. Neste ponto, vou tentar um ângulo diferente e assumir que pode ser um problema de software. Este artigo me fez pensar se poderia ser um problema no kernel: link

Por isso, atualizei para a versão 3.8 (3.8.0-37-genérica) do kernel do Raring para ver se ele resolve o problema. Como sempre, informarei em breve.

Atualização 8

Depois de correr por mais de 10 dias no novo kernel, eu ainda tenho que congelar meu laptop uma única vez. Neste ponto, é mais provável que a interação do kernel com o hardware seja a culpa. Eu estarei adicionando uma resposta definindo o que eu fiz para instalar o kernel mais novo para que outros que se deparam com este problema tenham uma solução.

    
por Soviero 15.02.2014 / 01:53

1 resposta

0

Problema resolvido!

Depois de trabalhar nesse problema por semanas, descobri que instalar uma versão mais nova do kernel era a minha solução.

Instalar um kernel mais novo no Ubuntu é bastante fácil e à prova de erros. Basta instalar o pacote linux-generic-lts-raring do repositório. Obviamente, existem outros kernels, mas foi esse que consertou isso para mim.

    
por 23.03.2014 / 04:05