Laptop funcionando ~ 30 ° mais quente que o normal; CPU / carga é supostamente normal. O que poderia causar isso e como posso diagnosticar isso?

10

Estou executando o Arch Linux mais recente em meu laptop ThinkPad t420 e estou tendo um problema de aquecimento intermitente, no qual minha temperatura aumentará de 45 ° C para ~ 75-90 ° C e permaneço lá até que eu reinicie. .

Eu executei várias ferramentas de diagnóstico, incluindo o óbvio htop e outras que o googling sugeriu, incluindo powertop , iostats e, com certeza, outras que não me lembro. Até agora não encontrei problemas óbvios e, aparentemente, não houve diferenças nas leituras, quer minha máquina esteja funcionando normalmente ou neste estado quente.

Eu também matei a maioria dos processos suspeitos um por um (bancos de dados e outros daemons), na esperança de encontrar o culpado oculto, sem sucesso.

Além dessas tentativas, não sei onde começar a solução de problemas . Espero que alguém possa me apontar na direção certa para começar a procurar a questão mais profunda.

Para ser preciso, minha pergunta não é como resfriar minha máquina, mas sim o que poderia causar uma mudança de calor consistente de mais de 30 graus em um sistema onde (supostamente) CPU e carga são normais? E quais ferramentas / práticas eu poderia usar para diagnosticar isso?

Algumas notas que podem ser úteis:

  • Eu posso esfriar o sistema (por exemplo, desengatando o controle do ventilador completamente), mas ele imediatamente se aquece novamente se deixado sozinho. Isso parece sugerir que a retenção de calor não é um problema, mas alguma coisa está continuamente gerando calor.
  • O uso e a carga da CPU são relatados por htop como normal após a digitação deste estado de ativação. Isso inclui threads do kernel. De acordo com htop , o sistema é essencialmente ocioso (1-2% de uso da CPU em todo o sistema, uma carga de 0,10).
  • Minha máquina usa gráficos integrados Intel HD e não possui outra placa gráfica . Um cartão da nVidia era uma opção para este modelo, como observado por @braiam; Eu não optei por isso.
  • @terdon atualizou as configurações do controlador da CPU. Minhas CPUs estão definidas para powersave
  • Meu processador específico é um Core i7-2620M de 2,7 GHz.

Editar : no momento em que escrevo esta pergunta, meu fancontrol não estava funcionando corretamente e funcionava continuamente em um intervalo médio de RPM (3900 RPMs), mesmo em altas temporadas. Por sugestão de @Alex e @JustDanyul, isso foi corrigido. O problema subjacente, no entanto, ainda permanece.

    
por numbers1311407 07.08.2013 / 15:57

5 respostas

6

O ventilador

O meu também faz isso, executando o Fedora 14. Tente obter uma lata de ar comprimido e soprar as aberturas na parte de trás e lateral do gabinete.

Também periodicamente você vai querer remover o teclado e soprar ar comprimido diretamente nas pás do ventilador. Eles ficam cheios de poeira e começam a efetivar sua eficácia reduzindo o peso.

A melhor coisa sobre os Thinkpads são os manuais de serviço! Eles mostram como derrubar seu laptop e juntá-lo novamente.

Processo incorreto

A outra coisa que eu notei é que ocasionalmente terei um processo que deu errado e consumirá 100% de um dos núcleos. Matar esse processo geralmente traz a temperatura de volta ao normal.

Você pode usar htop ou top para ver qual processo é esse e também pode matá-lo do terminal dele ou de um terminal usando PID .

o que mais?

Veja minha resposta a esta pergunta e resposta para obter mais dicas sobre como obter leituras de temperatura dos vários componentes de seu laptop. O Q & A é intitulado: Como obter a temperatura central dos núcleos haswell i7 no i3status .

    
por 07.08.2013 / 16:08
3

Este é mais um longo comentário, mas você deve dar uma olhada em thinkwiki.org que é recurso para Linux em ThinkPads. Quanto à temperatura, eu tive problemas semelhantes com o meu t4500 e resolvi jogando com

  1. O controlador da CPU que controla a escala de frequência da CPU. Suas escolhas são:

    • Desempenho mantém a CPU na maior frequência possível
    • O Powersave mantém a CPU na menor frequência possível
    • O Espaço do usuário exporta as informações de frequência disponíveis para o nível do usuário (por meio do sistema de arquivos / sys)       e permite o controle do espaço do usuário da frequência da CPU
    • Ondemand dimensiona as frequências da CPU de acordo com o uso da CPU (assim como a escala de frequência do espaço do usuário      daemons, mas no kernel)
    • Conservador age como o ondemand, mas aumenta a frequência passo a passo

    Com ondemand , sua CPU só será executada na velocidade mais alta quando necessário. Idealmente, isso será completamente transparente para você, sua máquina simplesmente funcionará tão rápido quanto necessário para as tarefas atuais. Para ativá-lo, faça

    sudo echo ondemand > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
    
  2. Controle do ventilador. Existe um utilitário muito bom chamado " Simple Power Control do ventilador " que permite ajustar as temperaturas de disparo que mudam a velocidade do ventilador. Também dê uma olhada nas informações aqui .

por 07.08.2013 / 17:21
1

sensors shows my fan buzzing along at ~3900 RPM

Mesmo com temp como ~ 75-90 ° C?

as manually ramping up the fan will cool the machine temporarily

Então, um problema é apenas que a velocidade do ventilador não está funcionando automaticamente?

Esqueça o auto, você pode ler a temperatura corretamente e você pode controlar a velocidade do ventilador manualmente, certo? Se for o caso, tudo o que você precisa fazer é encontrar um script de controle de ventilador ou projetar o seu próprio (sondar a temperatura e definir a velocidade de acordo com a tabela temp[i]=speed[i] , quando você definir uma velocidade maior, mantenha-a por a temperatura descer, quando você precisar diminuir a velocidade, vá devagar e passo a passo).

Sobre a enquete, o melhor seria ter um daemon monitor de temperatura que acionasse eventos de mudança térmica, e o script de controle do ventilador escutando / esperando por esses eventos, eu pensei (talvez erradamente) uma vez que era acpid mas hoje em dia não sei.

Em ambos os casos (seu próprio script / existente) enquanto você não está confiante com a solução, fique sempre atento à temperatura e à rotação, o ventilador não deve parar.

Resolva este problema auto primeiro e, se o sobreaquecimento persistir, pode concentrar-se na causa.

editar

Você pode experimentar uma ferramenta como lttng para coletar estatísticas de todo o sistema ao longo do tempo, mas pode não ser fácil de configurar e pode ser dispendioso em termos de armazenamento se precisar coletar por um longo tempo.

    
por 12.08.2013 / 00:48
1

Como a aceleração manual do ventilador resolve o problema, esse seria um excelente local para iniciar a solução de problemas, já que isso parece sugerir que o controle automático do ventilador não está funcionando.

Agora, você roda o arch linux, que é uma distro brilhante (sim, eu corro também) com um ótimo wiki. Então, eu tenho que perguntar, você fez RTFM? p

link

Tanto quanto eu posso ver, você precisa:

  1. ative o módulo do kernel thinkpad_acpi
  2. instale e configure o aplicativo thinkfan a partir do AUR
  3. ativar o serviço do sistema thinkfan

Isso tudo foi feito?

UPDATE Fico feliz em saber que seu fã agora está funcionando corretamente, em vez de apenas girar em um meio feliz. (Acho que isso resolveu o problema de sua máquina funcionando a temperaturas acima de 80 graus?)

No que diz respeito a responder qual é a causa subjacente de uma mudança de temperatura de 30 graus, bem, estou tentado a perguntar: não poderia ser por causa do fato de que seu fã não estava funcionando corretamente?

Vamos postular isso,

  • o processador não está funcionando mais que o normal
  • as flutuações de temperatura agora são substituídas por flutuações de velocidade do ventilador
Não seria seguro assumir que pode não haver nenhum problema, e que o problema era simplesmente que você estava correndo em um nível em que mal conseguia lidar? E pequenas mudanças na temperatura ambiente etc, colocá-lo acima do limite de suas capacidades?

Por exemplo, eu tinha um laptop Acer, e em dias quentes, o ventilador estava "constantemente" girando para cima e para baixo. Eu aposto que se meu fã não fosse capaz de se ajustar, eu teria visto grandes variações de temperatura também:)

    
por 12.08.2013 / 12:56
1

Eu acho que há um problema sobre o que você percebe ser "quente". Para o Thinkpad t420 ( de acordo com os fóruns ) é de cerca de 80-85 C e permite esquecer a placa nVidia que pode causar um aumento da temperatura também (na verdade a configuração do Optimus pode não funcionar bem, forçando sua CPU para fazer o trabalho da GPU). Dito isto, seu máximo de CPU temperatura tolerada é 100C (se chegar lá o sistema será desligado), enquanto o ambiente é sobre 10.0 ° C a 35.0 ° C . Dito isto, se o seu laptop estiver dentro da faixa está tudo ok (exceto pela duração da bateria e do notebook).

Agora você queria apontar possíveis suspeitos. Nesse aspecto, eu diria que a má implementação da nVidia com o Linux pode dar trabalho à sua CPU que não será mostrada no htop (ou em qualquer lugar) devido ao infame sistema On-Demand Optimus, que parece se encaixar em sua situação atual ( funciona bem até um momento, apenas começa a aquecer sem controle). Você deve atualizar sua instalação até ter o Bumblebee totalmente configurado. Você pode usar o bbswitch para dissolver o cartão da nVidia à vontade e ver como está indo.

Para instalar o Bumblebee for Arch, você pode encontrar o pacote no repositório. Se você ainda não instalou.

    
por 09.08.2013 / 22:16