Relatório de condição do HDD

2

Eu sou novo no Ubuntu e estou usando um HDD conectado ao eixo da unidade óptica e às vezes recebo erros, considerados pela comunidade como erros com cabo SATA e fonte de alimentação ruins. Eu escaneei meu HDD com a ferramenta de controle GSmart e obtive a seguinte saída:

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   119   099   006    Pre-fail  Always        -       202850112
  3 Spin_Up_Time            0x0023   100   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   099   099   000    Old_age   Always       -       1114
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002f   081   060   030    Pre-fail  Always       -       135948945
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       2779
 10 Spin_Retry_Count        0x0033   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       589
183 Runtime_Bad_Block       0x0032   019   019   000    Old_age   Always       -       81
 184 End-to-End_Error        0x0033   100   100   097    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   096   000    Old_age   Always       -       8590065937
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   060   057   045    Old_age   Always       -       40 (Min/Max 35/41)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       46
192 Power-Off_Retract_Count 0x0022   100   100   000    Old_age   Always       -       3
193 Load_Cycle_Count        0x0032   081   081   000    Old_age   Always       -       38019
194 Temperature_Celsius     0x0022   040   043   000    Old_age   Always       -       40 (0 17 0 0 0)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   199   000    Old_age   Always       -       312
254 Free_Fall_Sensor        0x0032   100   100   000    Old_age   Always       -       0

Como sou um novato, ficaria extremamente grato se alguém me explicasse como interpretar essa saída e o que devo fazer. Obrigado.

    
por Tristan Tzara 03.06.2016 / 09:27

1 resposta

2

Esses são dados SMART usados para o autodiagnóstico da unidade. Você pode encontrar uma boa explicação sobre como interpretá-la aqui (dê uma olhada nas outras respostas também):

  
  • Valor: esse é o valor bruto que o controlador reporta. Normalmente, é fácil entender o valor (como o poder em horas ou a temperatura), mas às vezes não é (como a taxa de erro de leitura). Diferentes fabricantes podem usar diferentes estruturas e significados para esses dados.
  •   
  • Normalizado: Este é o valor acima normalizado, portanto, um valor mais alto é sempre melhor. Portanto, 114 em taxas de leitura / erro são melhores que 113. Novamente, como seu disco rígido converte dados brutos em valores normalizados é específico do fornecedor.
  •   
  • Pior: O pior valor normalizado que seu motorista teve no passado (em que 99 é provavelmente a configuração de fábrica).
  •   
  • Limite: Quando o valor normalizado é menor que esse valor, o driver provavelmente falhará.
  •   

Como afirmado na resposta, o valor normalizado deve estar acima do valor limite e todos os atributos pre-fail do seu relatório parecem satisfazer essa condição. O único atributo suspeito para mim é End-to-End_Error , cujo valor normalizado está próximo de seu valor limite. Mas, de acordo com isso :

  

Este é um parâmetro crítico. A degradação desse parâmetro pode indicar uma falha iminente do drive. Recomenda-se a substituição urgente de dados e backup de hardware.

Você não deve se preocupar - End-to-End_Error valor limiar é propositadamente definido alto, pois parece indicar problemas muito perigosos com o HDD - todos End-to-End_Error os valores são os mesmos dos meus 6 meses de idade WD Black, que nunca causaram problemas.

Eu tenho que notar que o problema com HDDs girando novamente aconteceu comigo duas vezes com dois HDDs diferentes - esses HDDs agora funcionam bem, um tem o cabo molex substituído e outro tem melhor PSU de rack externo - então pode ser apenas um problema com cabeamento de energia ou PSU.

Mas, apenas no caso , salve este relatório SMART e execute novamente o diagnóstico após algumas semanas - apenas para verificar se algum valor pre-fail normalizado caiu - o que pode indicar problemas piores do que apenas problemas de cabeamento elétrico.

Além disso, seria ótimo se você pudesse testar a unidade em outra PSU, apenas para ter certeza de que ela está fornecendo bastante suco - no meu caso, rack externo não forneceu corrente suficiente em barramento de 12V e isso foi fazendo com que o HDD gere novamente.

    
por gogeccc 03.06.2016 / 20:04