Eu percebi que essa discussão é um pouco antiga, mas quero adicionar meus 2 centavos. Eu encontrei a informação inteligente para ser um bom indicador de pré-falha. Quando você obter um limiar inteligente desarmado, substitua a unidade. Isso é o que esses limites são para.
Na maior parte do tempo, você começará a ver setores defeituosos. Esse é um sinal claro de que a unidade está começando a falhar. A SMART me salvou muitas vezes. Eu uso o software RAID 1 e é muito útil, pois você simplesmente substitui a unidade com falha e recria a matriz.
Eu também faço auto-teste curto e longo semanalmente.
smartctl -t short /dev/sda
smartctl -t long /dev/sda
Ou adicione /etc/smartd.conf e envie-o por e-mail se houver erros
/dev/sda -s L/../../3/22 -I 194 -m someemail@somedomain
/dev/sdb -s L/../../7/22 -I 194 -m someemail@somedomain
Certifique-se de instalar o logwatch e redirecionar a raiz para um endereço de e-mail e verificar os e-mails diários do logwatch. Sinalizadores tripulados do SMARTD aparecerão lá, mas não é de nenhuma ajuda se ninguém estiver monitorando isso regularmente.