Linux mata os programas usando páginas de memória com bits invertidos além da recuperação (assim, uma palavra ECC com 2 flips), usando um sinal SIGBUS. Em seguida, ele coloca essa página na lista negra para que ela não seja reutilizada.
Ao encontrar falhas corrigidas repetidamente (normalmente não é o caso de inversões transitórias, mas com falhas difíceis que persistem após a correção), as páginas são migradas de forma transparente para outra página física, mas usando os mesmos endereços virtuais. Isso é feito por meio de um contador "leaky bucket", que conta erros de ECC por página nas últimas X unidades de tempo.
Estas abordagens são, respectivamente, chamadas de sublinhado (hard and soft page). Você pode ler mais e acessar estatísticas / logs de erros através do mcelog , que faz parte de todos os kernels Linux a partir da versão 2.6. Note que você pode configurá-lo para que seu kernel entre em pânico e reinicialize a máquina a cada erro, se desejar.
Isso também existe sob o nome de desativação de páginas de memória nos sistemas Solaris, e outros sistemas operacionais, sem dúvida, têm sua própria versão, embora eu não saiba os nomes ou referências do topo da minha cabeça.
Em suma, o hardware relata os erros e o sistema operacional atenua seus efeitos. Então, as chances são que você não vai ter muitos sintomas, mas você pode pedir ao seu sistema operacional ou ferramentas estatísticas.