O superaquecimento da CPU pode causar corrupção de dados?

3

Antecedentes:

Eu percebi recentemente, graças a dmesg e syslog , que minha CPU está superaquecendo desde maio. Sem overclock. Eu tenho um Intel® Core ™ i5 -2500K , e o cooler de estoque estava simplesmente com defeito, tanto quanto eu posso dizer. Eu sei que deveria ter ficado de olho no dmesg para erros de hardware, mas eu só vi:

CPU2: Core temperature above threshold, cpu clock throttled

De vez em quando, eu não pensava muito nisso. Obviamente, terei mais cuidado no futuro. Tanto quanto eu posso dizer, os tempos de CPU estavam em torno de 90 ° C.

Eis a minha pergunta:

Eu copiei muitos dados desde maio, minhas fotos, gravações de banda, etc ...

É possível que meus dados tenham sido corrompidos silenciosamente por esse problema? Suponho que as CPUs tenham ECC ou checksums incorporados, mas não tenho certeza. A última coisa que eu quero, claro, é ter usado o meu computador todo esse tempo e agora, de repente, todos os meus dados foram silenciosamente corrompidos. Qualquer pensamento é muito apreciado.

    
por cat pants 13.09.2015 / 03:04

1 resposta

2

Você afirma isso:

Is it possible that my data has been silently corrupted by this issue? I’m guessing that CPUs have ECC or checksums built in, but I’m not sure.

Sim, os principais sistemas de computação têm capacidade ECC, mas pelo que entendi da arquitetura moderna da CPU, as próprias CPUs podem rodar até 90 ° C, desde que a temperatura não seja mantida a todo o momento a 90 ° C.

Ou seja, se o seu sistema está chegando a 90 ° C e, em seguida, caindo novamente para algo menor do que isso, não deve haver problemas. E mesmo assim, o pior aspecto da execução de uma CPU a 90 ° C é que você literalmente queima a CPU mais rapidamente; corrupção de dados pode acontecer, mas isso será óbvio rapidamente.

Esqueça seus arquivos de dados, seu sistema central de SO começará a desmoronar diante dos seus olhos. Esta página em “Impacto da temperatura no desempenho da CPU Intel” explica muito bem:

Sensitive electronics like CPUs have a finite lifespan and running them at higher temperatures shortens it. So unless you want to have an excuse to upgrade your system often, higher temperatures are counter-productive.

With PC hardware, higher temperatures make both minor and major hardware faults much more likely. These hardware faults can result in anything from reduced performance due to minor errors needing to be corrected to data corruption or bluescreens due to more dramatic errors.

Também digno de nota são as três principais conclusões:

  1. Modern Intel CPUs run at full speed (including the full Turbo Boost allowed based on the number of cores and workload) all the way up to 100 °C
  2. Even after the CPU hits 100 °C, the performance is not greatly affected until the CPU spends about 20% of the time > 99 °C
  3. While stock cooling only causes around a 2.5% drop in performance, even a budget after market cooler will dramatically improve CPU temperatures

Portanto, parece haver alguma confirmação de que a pior coisa que pode acontecer por causa da execução de um CPU moderno a 90 ° C ou mais é uma vida útil encurtada da própria CPU; não muito mais.

Dito isso - e isso é em grande parte anedótico - mas, no que diz respeito à sua pergunta:

I’ve copied a lot of data since May, my pictures, band recordings, etc…

Na minha experiência, os arquivos que possuem dados corrompidos não podem ser copiados - com o próprio sistema interrompendo a cópia devido a algum erro de leitura de dados - ou os próprios arquivos mostram alguma data de modificação de dados que parece estar desativada. Como se você tivesse uma foto de 2012 que você nunca tocou, mas de repente ela tem uma data de modificação de 2015 que de alguma forma corresponde à data em que você copiou o arquivo, então eu me preocupo.

Mas não deixe o pânico sobrecarregar você. Estou bastante confiante de que, se as temperaturas de 90 ° C forem relativamente esporádicas e não forem sustentadas, seus dados devem estar bem. Se você fosse capaz de copiar os arquivos, então eu acredito que eles estão bem.

Dito isso, procurei em um PDF a folha de dados oficial da Intel para o e achei que é alguma informação pertinente na página 71 onde o TCC (Circuito de Controle Térmico) a temperatura de ativação é de 96 ° C para essa família de CPUs. Quando o TCC é acionado, a CPU reduz os ciclos da CPU na tentativa de se resfriar.

Então, se você está percebendo temperaturas de CPU de 90 ° C e ocasionais "CPU2: temperatura do núcleo acima do limite, clock acelerado", significa que ocasionalmente a CPU está acima de 96 ° C, acelerando os ciclos da CPU para esfriar e então você está de volta abaixo de 96 ° C.

O que significa que, se você me perguntar, você deve ver como consertar o cooler / ventilador da CPU. Mas na medida em que danifica os dados no seu sistema? Eu não acho que ocasionais 96 ° C + que são controlados com sucesso pelo sistema fariam qualquer coisa no seu sistema além de encurtar a vida da própria CPU.

    
por 13.09.2015 / 03:50