Se alguém conseguisse detectar facilmente quando setores estão prestes a ficar ruins ou ir mal, provavelmente teria sido trabalhado no sistema de arquivos até agora. Devido à natureza do erro, ele geralmente fica em silêncio. Você precisa de um sistema de arquivos que faz checksum. No GNU / Linux, o BTRFS pode ser uma boa aposta desde que eu olhei online e aparentemente o suporte foi introduzido no Debian 6.
Basicamente você precisa de checksum + raid (de algum tipo). Um sistema de arquivos só pode corrigir automaticamente se tiver pelo menos duas pernas em uma configuração RAID. Sem uma segunda etapa para ir, ela não tem para onde ir, a fim de encontrar uma cópia verificável do arquivo. Felizmente, você deve ser capaz de criar uma matriz RAID1 usando duas partições diferentes no mesmo disco (ou volumes lógicos, o que quer que você tenha disponível):
Obviamente,colocá-losnomesmodisconãoprotegecontraumdiscocompletamentedefeituoso,masprotegecontrasetorescomfalha.SimularumsetorfalidoéprovavelmentemaistrabalhodoqueeudeveriacolocaremumarespostaSE,mas
Basicamente, o BTRFS recuperará opacamente o arquivo e o espaço do usuário não saberá que algo aconteceu. Você pode usar o btrfs scrub
para detectar erros após o fato. Você pode executar isso em um cronjob e mandar um e-mail para uma de suas contas locais. Depois disso, você pode configurar /etc/aliases
para encaminhar a saída do comando para sua conta de e-mail real.