A estatística dada 1 erro de leitura em 10 ^ 14 é apenas isso, um ponto de dados estatísticos. Isso não significa que em qualquer disco você verá erros e não diz que isso necessariamente acontece desde o início da vida útil do disco até o fim. Significa apenas que o disco não é tão alto quanto os discos corporativos e, com base na minha experiência (desenvolvendo sistemas de armazenamento corporativo), o consumidor e os discos corporativos nunca atingem os números MTBF completos. Eu não me lembro de uma grande diferença entre eles também. Houve alguma diferença, mas não muito grande.
Quando um bloco está sendo lido e isso falha, o disco colocará o setor em uma lista de espera. Quando o setor for escrito em seguida, a gravação será tentada e o setor será verificado, se isso funcionar, nada será feito mais adiante. Se a verificação falhar, o setor será realocado.
Em muitos casos, os discos e o RAID podem corrigir setores defeituosos em tempo real, mesmo antes de se tornarem um grande problema. Há uma varredura de mídia em segundo plano do disco e a limpeza do disco da matriz RAID e ambas funcionam para proteger os dados. Os arrays de armazenamento corporativo usam verificações mais refinadas para garantir que até mesmo setores de disco levemente problemáticos sejam tratados e corrigidos.
Existem outros problemas com o uso de unidades consumidoras em uma matriz RAID, o TLER é um deles, essencialmente significa que você pode perder o disco para até mesmo um setor defeituoso, pois o disco pára de responder até conseguir ler o setor. TLER é realmente o método para evitar que o RAID chamando o disco falhou quando é apenas um pequeno problema de mídia. Se você tiver o TLER ativado, o disco irá desistir rapidamente do setor e deixar o RAID lidar com a falha em seu nível.