Gravidade de um erro de disco “inteligente”. Quanto tempo vai durar?

5

Eu tenho um disco de dados de 1 TB e o BIOS e o Windows estão relatando um erro "Inteligente". Pelo menos, recebo um evento inteligente, mas isso não indica a gravidade da falha. O meu sistema tem cerca de 6 meses de idade, incluindo o disco, pelo que a garantia cobre os danos. Infelizmente, falta um segundo disco de 1 TB de tamanho que eu possa usar para fazer um backup completo. Os dados mais importantes neste disco são seguros, mas há muitos dados de trabalho que podem ser regenerados, mas isso custaria muito tempo.

Então eu pedi um disco USB de 1 TB que chegará em três dias. A essa altura, posso fazer um backup completo dos dados e, depois, ele pode falhar.

Mas o disco vai durar tanto tempo assim? (Bem, eu não usarei o PC enquanto eu não puder fazer um backup.) Quão sério é um evento tão inteligente? Eu sei que é sério o suficiente para tê-lo substituído, mas vai viver por mais uma semana ou poderia morrer a qualquer momento?

Atualização: comprei um disco externo de 1 TB e passei a maior parte do dia fazendo um backup do disco de 1 TB. Ele sobreviveu a isso. Recebi então um novo disco, pois ainda estava na garantia e substitui o disco rígido. Então tive que passar a maior parte do dia novamente para recuperar o backup. Eu preciso enviar de volta o disco defeituoso e agora tenho um disco externo adicional, que sempre poderia ser prático. :-)

O relatório de erro inteligente não causou nenhuma falha no disco original. Não aconselho ignorar esses avisos, mas o disco ainda tem vida suficiente para durar mais alguns dias. (Apenas certifique-se de ter um bom back-up.)

E oh, o horror de ter que fazer um backup completo como um disco enorme. :-) Se os seus dados forem importantes, certifique-se de ter algo que suporte backups incrementais e muito espaço. (No meu caso, os dados não eram muito importantes, apenas é prático ter no disco juntos.)

    
por Wim ten Brink 13.12.2009 / 14:44

4 respostas

5
O

link pode mostrar exatamente quais são os erros SMART e, a partir disso, você pode determinar o quanto é sério. Geralmente eu substituiria a unidade o mais rápido possível, mas se você estiver hesitante, execute o HDTune e veja exatamente o que está ficando sem especificação.

    
por 13.12.2009 / 17:52
3

Os eventos SMART não garantem falhas, e as unidades podem viver por um longo tempo após um evento SMART. Dito isso, estatisticamente falando, depois de uma SMART ter ocorrido em uma unidade, a probabilidade de falha nos próximos meses aumenta.

Seu disco certamente está degradando e um evento SMART é uma indicação muito boa de um problema iminente. Mas o problema pode demorar semanas ou meses ou até mais. E mesmo que um ponto ruim apareça na unidade, a própria unidade pode compensar o erro substituindo o setor com falha por um dos setores sobressalentes que todos os discos modernos mantêm para esse propósito.

Em conclusão, não há necessidade de entrar ainda no modo de pânico. Mas certifique-se de ter backups em todos os momentos.

    
por 13.12.2009 / 17:48
3

Os erros SMART não são reportados muito bem no Windows, como as respostas anteriores mencionam. Ignorá-los não é uma boa ideia. O HD Tune mencionado anteriormente é uma boa idéia, você pode verificar os números de contagem do setor realocado e contagem de repetição de rotação. Esses são os dois realmente ruins. Um erro SMART também pode ser causado pelo superaquecimento da unidade, portanto, você deve verificar se não está ficando muito quente. Se é doloroso deixar o dedo tocando por mais de alguns segundos, então está muito quente.

Além de tudo isso, você deve descobrir o fabricante da unidade e usar suas ferramentas de diagnóstico para verificar a integridade da unidade. Normalmente, são uma combinação de uma verificação de dados SMART, além de uma varredura completa do setor de leitura da unidade. Apenas esteja atento para usar as verificações de disco não destrutivas (99% delas são, mas não faz mal ter cuidado). Se a ferramenta de diagnóstico do fabricante reportar falha, você deve RMA a unidade.

Esteja ciente de que nem todas as ferramentas de diagnóstico do fabricante são criadas da mesma forma, infelizmente, e sua unidade pode estar morrendo, mesmo se a ferramenta disser que está tudo ok. Um bom para usar é o Teste de Fitness da IBM / Hitachi Drive no último CD de inicialização . Se falhar nesse teste, não confiaria na unidade. Esse cd também tem outras várias ferramentas de diagnóstico de disco rígido.

    
por 14.12.2009 / 06:21
2

Suas perguntas são difíceis de responder. Do artigo da Wikipedia sobre S.M.A.R.T.

"The purpose of S.M.A.R.T. is to warn a user or a system administrator of impending drive failure while there is still time to take preventive action, such as copying the data to a replacement device. Approximately 64% of failures can be predicted by S.M.A.R.T.[2] Work at Google on over 100,000 drives has shown little overall predictive value of S.M.A.R.T. status as a whole, but suggests that certain sub-categories of information which some S.M.A.R.T. implementations track do correlate with actual failure rates – specifically, in the 60 days following the first scan error on a drive, the drive is, on average, 39 times more likely to fail than it would have been had no such error occurred. Also, first errors in reallocations, offline reallocations and probational counts are strongly correlated to higher probabilities of failure.[3]"

Sugiro:

  1. manter o uso da unidade com falha para um mínimo
  2. fazendo backup de seus dados para o novo dirigir o mais rápido possível
  3. contatando o fabricante do unidade para substituição (se for ainda no período de garantia)
por 13.12.2009 / 14:53