As unidades podem ser marcadas como falhas em uma matriz por vários motivos. Talvez haja alguns setores defeituosos. Talvez as cabeças da unidade estejam falhando. Talvez os raios cósmicos atinjam sua unidade no ângulo certo e no tempo para falhar em uma varredura. Talvez o firmware deles tenha um bug que quebra.
Algumas dessas falhas são reparáveis, outras não.
O problema é que é realmente difícil prever falhas no disco rígido. O documento infame do Google descobriu que o SMART só era útil em que, se fosse alertado, as unidades tinham maior probabilidade de falhar do que se isso não acontecesse. Totalmente 36% das unidades com falha não tinham erros SMART, fatais ou não. Assim, você pode executar um conjunto completo de digitalizações SMART, não encontrar nenhuma e não saber mais do que você faz agora.
Mas, supondo que isso seja uma falha inesperada e não uma falha "eu-fiz-algo-engraçado-e-falhou", você já tem uma indicação de problemas com o disco. Agora é uma questão de valor.
- Quanto custa uma outra unidade?
- Quanto tempo seria perdido para seus usuários se este servidor morresse?
- Quanto do seu tempo seria perdido se este servidor morresse?
- Quanto vale todo esse tempo?
- Duplique este valor para contabilizar (ingenuamente) o custo de oportunidade
Eu nunca estive em uma situação em que valesse a pena deixar uma unidade falhar. Por que passar pela dor? As chances são, a unidade que você precisa é muito barata. Compre e siga em frente.