A resposta é sim, e é feita de forma transparente (desde que você tenha memória ECC para detectar erros, e sua versão do kernel seja pelo menos 2.6.30 para continuar a operar com segurança).
Basicamente, sua memória é verificada a cada leitura do processador e limpa periodicamente *, para verificar a consistência com o ECC (Error Correcting Codes). Se um erro ocorrer, você recebe uma Exceção de Verificação de Máquina, que é então registrada e capturada pelo mcelog ( link ).
Se o erro puder ser corrigido, ele incrementará um contador "leaky bucket", o que faz com que um DIMM físico que falha com frequência seja substituído de forma transparente por outro. Assim, sua página de memória é copiada para um novo local, seu endereço de memória virtual é atualizado para apontar para a nova página, e a página antiga é marcada pelo sistema operacional para não ser mais usada.
Isso é chamado de "soft-offlining" no Linux (e desativação da página de memória no Solaris, eu não sei sobre outros sistemas operacionais).
Se o erro não puder ser corrigido, o que é chamado de "hard-offline" acontece, isto é, sua página de memória é removida do gerenciamento normal de memória do sistema operacional e seu aplicativo é eliminado (NB: por algum sinal SIGBUS disponível) diz-lhe onde o erro aconteceu, mas é raro o suficiente não se importar e tentar pegá-lo). Se a sua página de memória é mapeada de um arquivo e limpa, o sistema operacional também pode recarregá-la de forma transparente em outro local físico, em vez de eliminar o processo.
Você pode ler mais sobre o mcelog, existem muitas opções de configuração, você pode obter outros comportamentos a serem acionados, opções e outros leads sobre o que ler e como certificar-se de que o mcelog está sendo executado em seu sistema.
* Scrubbing, ou "Patrol Scrubbing" consiste em ler a memória, verificar erros no ECC e sobrescrever com as palavras de memória corrigidas quando um erro é descoberto. O termo scrubbing de patrulha é usado por oposição à sobrescrita de dados incorretos sobre erros em leituras de memória, que às vezes é chamado de "Demand Scrubbing". Esfregar é um procedimento de hardware que pode ser ativado, geralmente por meio do BIOS.