Problemas no disco rígido - SpinRite vs. S.M.A.R.T

8

O disco rígido da Toshiba em um laptop Sony VAIO foi ruim. Eu coloquei uma unidade Western Digital (WD1600BEVS-60RST0, firmware v4.01G04) de um laptop HP. Eu corri SpinRite no nível 2 e encontrei alguns setores defeituosos, mas parecia recuperar dados e marcar. Eu corri o SpinRite no nível 5, e levou aproximadamente 30 horas, mas terminou limpo - sem relato de problemas.

No entanto, quando eu inicializo, recebo um S.M.A.R.T. erro dizendo algo para o efeito de "falha de unidade é iminente!" Então estou um pouco confuso - o SpinRite disse: "tudo bem!", Mas S.M.A.R.T. está dizendo " Perigo, Will Robinson! ". Em quem eu confio? O que está acontecendo? O que faz S.M.A.R.T. sabe que SpinRite não faz?

    
por Peter Mortensen 13.10.2009 / 15:54

4 respostas

7

Se o SpinRite não estiver lendo os próprios parâmetros SMART, possivelmente lotes.

Os valores SMART (tecnologia de automonitoramento, análise e geração de relatórios) são um conjunto de variáveis rastreadas pelo próprio inversor em relação a várias coisas, desde contagens relacionadas à idade geral (tempo de ativação, número de aumento de vida útil, ... ), monitoração de integridade básica (número de erros recuperáveis recuperados, tempo de rotação, número de setores remapeados devido a erro recuperável repetido, número de blocos reservados restantes para tal remapeamento, temperatura atual, temperatura máxima histórica, ...) bem como indicadores de falha explícitos (número de erros irrecuperáveis encontrados, número de falhas em autotestes anteriores, ...). A maioria desses contadores / flags tem um benchmark associado acima / abaixo do qual o drive começa a se considerar na saída.

Embora o SpinRite tenha transferido os dados desses setores desonestos e os tenha marcado no sistema de arquivos para que eles não sejam usados novamente, a unidade não sabe disso. Tudo o que sabe é que tem mais erros irrecuperáveis em seu estado salvo do que é feliz, e presumivelmente outros indicadores menos sérios de que sua condição é ruim e / ou declinante, e quando a BIOS lê isso, você avisa.

A unidade conhece sua própria condição melhor do que a SpinRite. Eu sugiro que você siga seu aviso e o substitua o mais rápido possível, caso o problema que causou os setores ruins se agrave. Pode não ficar pior (pode ter havido uma imperfeição muito pequena na superfície de um dos pratos e tudo o mais está bem), mas se você tem algum dado sobre o assunto que você se importa, você pode se dar ao luxo de correr o risco?

Uma ressalva: seu BIOS pode não estar lendo os indicadores SMART corretamente, mas como você realmente viu setores defeituosos relatados no nível do SO / aplicativo, duvido que esse seja o caso, então pode valer a pena pegar algum software para procurar neles mesmo. Há muitos utilitários disponíveis para varrer e exibir parâmetros SMART de suas unidades - você pode até encontrar um específico para o fabricante (que pode incluir descrições melhores de métricas que não são comuns / padrão). A SMART permite que a métrica específica do fabricante / modelo seja armazenados e lidos) fornecidos em seu site.

    
por 13.10.2009 / 16:15
3

Uma unidade SMART tem muitos indicadores de status , alguns dos quais indicam falha iminente da unidade . Qualquer unidade que indique o status de falha SMART deve ser substituída o mais rápido possível. É claro que você pode continuar usando a unidade até que ela falhe (possivelmente dias ou meses no futuro), mas não diga que você não foi avisado.

O sistema SMART não é infalível ... Eu só tive avisos avançados do SMART em dois drives (de cerca de 10.) Mas ambos falharam dentro de duas semanas após o aviso do SMART.

    
por 13.10.2009 / 16:33
2

S.M.A.R.T. conhece as temperaturas.
A SpinRite conhece os setores.

Portanto, o disco está aquecendo acima do limite que o seu S.M.A.R.T. o software está configurado para detectar como erro. Quando eu persistentemente tive esse problema durante um verão particularmente quente, eu como solução redefinir esse limite para uma temperatura mais alta que ainda estava bem dentro do intervalo de temperatura do fabricante.

Se esta solução não parece correta para você, ou a temperatura do disco está perigosamente próxima do limite superior do fabricante (eu considero isso em 10 graus), então seu disco está falhando.

Mas repito, esta é provavelmente uma configuração muito sensível para o seu S.M.A.R.T. Programas. De qualquer forma, de acordo com o SpinRite, o seu disco ainda não começou a falhar.

Mas não economize nos seus backups!

    
por 13.10.2009 / 16:06
1

Eu confiaria em algum grau no SpinRite se ele tivesse verificado e reescrito toda a superfície do disco. Mas você deve realmente usar algo como Smartmontools para descobrir qual S.M.A.R.T. parâmetro está acionando o alerta.

Pode ser que a quantidade de blocos danificados realocados seja muito alta ou que qualquer outro indicador de "idade avançada" de "pré-falha" seja muito alto. O SpinRite não pode redefinir esses indicadores, de modo que o over-all S.M.A.R.T. estado vai continuar reclamando.

O estado do disco pode ser mantido por algum tempo se o uso completo pelo SpinRite não encontrar mais erros, mas você deve continuar rodando o SpinRite, porque ele também atualiza blocos com erros mas corrigíveis ECC . Ou é só pegar um novo disco; -)

    
por 07.01.2010 / 23:51