Diferença entre S.M.A.R.T. erro 0x05 (setor realocado) e 0xC6 (setor incorrigível)

0

Meu HDD externo de 2 TB recentemente começou a reportar um número muito alto de erros 0xC5 (setores pendentes) (valor bruto: 309) e hoje reportou um erro de setor incorrigível (valor bruto: 1) enquanto a contagem do setor realocado permaneceu em 0. Pode ser irrelevante, mas minha contagem do setor pendente também foi incrementada em 1.

Se bem entendi, os setores pendentes que o firmware do HDD determina como ruins são realocados (ou remapeados), incrementando assim a contagem realocada do setor. Estou curioso para saber por que este setor que meu HDD determinou ser ruim não foi realocado e apenas marcado incorrigível. Qual é a diferença explícita entre os dois erros e por que um seria relatado em vez do outro? Estou certo em concluir que o setor incorrigível foi não realocado e que a unidade ainda tentará usar esse setor e causar problemas (por exemplo, paralisação ao tentar ler / gravar)?

    
por ZeroKnight 27.12.2013 / 07:20

1 resposta

2

Você está quase completamente certo, exceto que a interpretação de 0xC5 é mais delicada. De Wikipedia :

Count of "unstable" sectors (waiting to be remapped, because of unrecoverable read errors). If an unstable sector is subsequently read successfully, the sector is remapped and this value is decreased. Read errors on a sector will not remap the sector immediately (since the correct value cannot be read and so the value to remap is not known, and also it might become readable later); instead, the drive firmware remembers that the sector needs to be remapped, and will remap it the next time it's written.[29] However some drives will not immediately remap such sectors when written; instead the drive will first attempt to write to the problem sector and if the write operation is successful then the sector will be marked good (in this case, the "Reallocation Event Count" (0xC4) will not be increased). This is a serious shortcoming, for if such a drive contains marginal sectors that consistently fail only after some time has passed following a successful write operation, then the drive will never remap these problem sectors.

Como você pode ver, os setores 0xC5 são aqueles para os quais ainda há uma chance de recuperar os dados que eles contêm. Neste sentido, os dados em 0xC5 são congelados e o remapeamento ocorrerá se os dados puderem ser lidos e a integridade de seus arquivos restaurada completamente por meio do remapeamento

0xC6 é, em vez disso,

The total count of uncorrectable errors when reading/writing a sector. A rise in the value of this attribute indicates defects of the disk surface and/or problems in the mechanical subsystem.

Mais cedo no artigo, diz-se que:

Work at Google on over 100,000 drives over a 9-month period found correlations between certain SMART information and actual failure rates. In the 60 days following the first uncorrectable error on a drive (SMART attribute 0xC6 or 198), the drive was, on average, 39 times more likely to fail than it would have been if no such error occurred.

Você deve notar que a presença ou ausência de tais erros é não um poderoso indicador de falha de disco, porque grandes frações (cerca de um terço) de todos os HDDs falham sem um único aviso SMART. No entanto, uma vez que uma falha tenha ocorrido , as chances de se aproximar do fracasso são muito maiores.

Um comentário simples sobre o RAW_value : você tem sorte que o fabricante o use de maneira intuitiva, ou seja, como uma simples contagem desse tipo de erro. Você tem sorte porque a SMART não faz parte do padrão T13 / ATA; Os atributos RAW_VALUE são 64 bits de dados que podem ser codificados em qualquer formato que o fornecedor da unidade desejar. A Seagate (por exemplo, tenho alguma experiência com isso) codifica alguns de seus atributos; a fórmula para decodificá-las é desconhecida e não documentada. E o que é pior, eles não estão sozinhos em fazer isso.

    
por 27.12.2013 / 08:19