Considerando a gravidade do HD S.M.A.R.T. leituras

0

Descobri hoje que o HD do meu laptop emitiu um erro SMART. Eu passei pelos movimentos e fiz um clone de partição OS e fiz backup de dados valiosos. Esta é uma máquina de trabalho e estou em um orçamento muito apertado, então comprar uma unidade de substituição é proibitivo, mas não impossível, desde que eu possa demonstrar que a unidade está além da ajuda e de um risco real.

Veja o que eu recolhi:

  • chkdsk /r demora muito tempo, 1:30 horas para uma partição de 120 GB
  • O erro aparece no log de eventos com algumas mensagens bastante ameaçadoras, que surgiram enquanto o sistema estava suspenso.

(Estes são vagamente traduzidos do espanhol):

(Disk) The controller detected that the device \Device\Harddisk0\DR0 anticipated that an error will occur. Please perform a backup … yada yada

e

(DiskDiagnostic) Windows disk diagnostic detected a smart error in disk X (volumes C:\; D:\). There could be an error on the disk; please backup etc.

  • A unidade falhou no teste longo do Speedfan
  • Esta é a leitura SMART

    Attribute              Current      Raw
    Raw Read Error Rate      99         000000030000
    Throughput Performance   100        000000000000
    Spin Up Time             230        000900000000
    Start/Stop Count         100        00000000029B
    Reallocated Sector Count 100        000000000000
    Seek Error Rate          100        000000000000
    Seek Time Performance    100        000000000000
    Power On Hours Count     82         000000001FAE
    Spin Retry Count         100        000000000000
    Power Cycle Count        100        000000000296
    GSense Error Rate        100        000000000000
    Power Off Retract Count  100        000000000012
    Load Cycle Count         95         00000000EA39
    Reallocated Event Count  100        000000000000
    Current Pending Sector   100        000000000008
    Offline Uncorrectable Sector Count  100         000000000000
    Ultra DMA CRC Error Rate 200        000000000000
    Load Retry Count         100        000000000000
    
  • O Reflect falhou ao fazer backups até que eu ativei o cache de arquivos

  • Inicialização, uso normal e transferências de arquivos são rápidos como sempre.
  • chkdsk (sem parâmetros extras) encontra 4KB em setores defeituosos

Com tudo isso considerado, o que você acha da saúde dessa unidade? Eu sei que você pode executar algumas tarefas para forçar o remapeamento (embora este seja um tópico que eu precisaria pesquisar primeiro), mas o que eu não sei se este disco está em qualquer posição para valer as correções. Eu posso fornecer qualquer informação adicional necessária para um melhor julgamento.

Espero que alguém possa fazer algo com essas estatísticas estranhas!

    
por Felipe Bazignan 12.09.2017 / 23:35

2 respostas

2

O provedor de backup e armazenamento em nuvem Backblaze tem algumas informações que podem ser úteis . Em particular, eles observam cinco atributos que estão strongmente associados à falha iminente de disco:

  • Contagem de setores realocados
  • Erros não corrigíveis reportados
  • Tempo limite do comando
  • Contagem do setor pendente atual
  • Contagem de setor incorrigível

No seu caso, a unidade possui um valor bruto diferente de zero para Contagem do setor pendente atual ( veja esta questão ). Isso significa que, embora a unidade não tenha realmente remapeado nenhum setor com falha, ele detectou que alguns setores podem estar ruins e precisam ser remapeados na próxima vez que forem acessados.

Sua unidade provavelmente falhará em breve, portanto, você deve fazer o backup de seu conteúdo e substituí-lo o mais rápido possível.

    
por 12.09.2017 / 23:44
1

Esta é uma questão subjetiva - porque você quer saber se deve continuar usando a unidade. Não podemos dizer se você deve continuar a usar a unidade - essa é uma decisão que você deve se basear em diferentes fatores, como o impacto do tempo de inatividade e a perda de dados em sua organização.

O que não é subjetivo é o que a SMART é e o que o erro significa.

SMART ( Tecnologia de auto-monitoramento, análise e relatórios ; geralmente escrito como SMART) é um sistema de monitoramento incluído em unidades de disco rígido de computador (HDDs) e em estado sólido drives (SSDs) 1 que detecta e relata vários indicadores de confiabilidade do drive, com a intenção de permitir a antecipação de falhas de hardware.

link

A mensagem SMART que você forneceu traduzida livremente significa " sua unidade está em risco de falha iminente " O sistema projetado e calibrado pelo fabricante do seu disco rígido detectou que a unidade se degradou além do seguro limites e que a falha é IMINENTE.

link

As falhas do "Teste longo" são uma confirmação adicional de que a unidade sofreu danos físicos significativos e continuará degradando levando seus dados com ela.

Sua unidade está falhando e destruirá seus dados. Você escolhe se deseja continuar usando.

    
por 12.09.2017 / 23:51