O que acontece com um erro de bit aleatório no cache de uma CPU Intel?

1

Eu tenho um sistema com memória RAM ECC e uma CPU Xeon E3.

Meu entendimento é que os circuitos ECC na RAM detectarão a corrupção de erros de bits aleatórios nos chips de RAM.

Mas o que acontece com erros de bit aleatórios dentro da memória armazenada em uma CPU Intel? por exemplo. o cache e / ou registra?

Não existe um buraco de cobertura onde uma boa RAM é armazenada na CPU, esta RAM em cache é então corrompida, e depois usada pela CPU (sem verificar a RAM ECC)?

Não consigo encontrar nenhuma informação no site da Intel, exceto para o topo da linha Xeon E7 sobre proteção de cache ECC.

Isso significa que qualquer CPU Intel abaixo da linha Xeon E7 é vulnerável à corrupção de memória, independentemente de você usar ou não a RAM ECC?

    
por ljbade 14.08.2014 / 15:04

1 resposta

0

Tudo o que você escreveu é verdade, exceto que você não está listando os motivos práticos para a correção de ECC. Eu recomendo a leitura do artigo abaixo. Agora, na aplicação prática, os sistemas usam correção de memória para realmente aumentar o desempenho, porque alguns hardwares e softwares são capazes de detectar inconsistências nos dados e solicitar o reprocessamento da transação. Além disso, é altamente improvável que um erro comum de bit único possa afetar seu trabalho. Na verdade, é mais provável que o superaquecimento de qualquer chip eletrônico em seu computador possa fazer com que o isolador permita o salto de um elétron (uma razão pela qual o overclocking faz com que os computadores falhem). A correção de memória é muito importante em cálculos de larga escala que não possuam outros meios de correção, como a modelagem meteorológica de cálculos científicos. Em qualquer lugar onde dados corrompidos seriam repetidos bilhões de vezes ou onde números longos de ponto flutuante são processados. Por essa razão, tanto quanto me lembro, todos os núcleos PileDriver e SteamRoller AMD, que podem combinar núcleos individuais para processar números de ponto flutuante de 256 bits, utilizam ECC na memória da CPU.

Alguns estão lendo aqui

    
por 15.08.2014 / 17:50