Meu teste SMART está falhando ou não?

1

Ele mostra que o teste terminou com read failure , mas o resultado geral é PASSED . Então, qual é o estado deste disco rígido?

root@master:~# smartctl -i /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-24-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital RE4 (SATA 6Gb/s)
Device Model:     WDC WD2000FYYZ-01UL1B1
Serial Number:    WD-WMC1P0385424
LU WWN Device Id: 5 0014ee 0ae6ce8de
Firmware Version: 01.01K02
User Capacity:    2,000,398,934,016 bytes [2.00 TB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sat Nov 25 02:04:28 2017 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

root@master:~# smartctl -H /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-24-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

root@master:~# smartctl -l selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-24-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%     19675         69299
# 2  Short offline       Completed: read failure       90%     19675         52526
# 3  Short offline       Completed: read failure       90%     19675         52526
# 4  Short offline       Completed without error       00%      5505         -

Atualização:

root@master:~/chef-usability# smartctl -A /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-24-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       1
  3 Spin_Up_Time            0x0027   166   164   021    Pre-fail  Always       -       6658
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       17
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   074   073   000    Old_age   Always       -       19698
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       15
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       13
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       77
194 Temperature_Celsius     0x0022   122   107   000    Old_age   Always       -       28
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       6
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       6
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       13
    
por Poma 25.11.2017 / 00:06

3 respostas

2

Seu log diz que quando você executou um teste on-line curto no momento em que seu disco rígido foi executado por 5505 horas no total, ele passou completamente.

No entanto, os três testes que você executou quando seu disco rígido foi executado por um total de 19675 horas, todos pararam depois de encontrar um setor defeituoso depois de ler 10% de todos os setores. Os dois primeiros testes encontraram este setor ruim em 52526, então ele provavelmente foi realocado e o teste mais recente encontrou um segundo setor ruim em 69299.

Pode haver setores mais ruins nos 90% restantes.

Agora, alguns setores defeituosos devem aparecer durante a vida útil do disco rígido (é por isso que o disco rígido pode realocá-los), mas em alguns casos isso seria péssimo para todas as propriedades SMART ( smartctl -A ) para ver se eu queria continuar usando esse disco.

Editar

As propriedades parecem boas (orientação de leitura: todos os valores são normados em 100, menor é pior), embora eu esteja um pouco confuso que Reallocated_Sector_Ct é (raw) zero. Apenas nas propriedades, o disco parece saudável. A próxima coisa que eu tentarei é tentar ler os dois setores sinalizados com dd (para outro disco rígido) usando o LBA indicado, gravá-los de volta se você puder lê-los ou escrever zeros ( /dev/zero ) de volta se puder leia-os. Então veja se o teste curto e / ou prolongado prossegue ainda mais.

    
por 25.11.2017 / 12:51
1

Você tem 6 setores que estão aguardando remapeamento. Eles só serão remapeados, no entanto, quando escritos para.

A solução mais fácil é simplesmente limpar o disco e reinstalar o que estiver nele.

Se houver apenas arquivos, você precisará movê-los para outro lugar. Isso falhará nos arquivos danificados.

Se você tiver um software instalado (como o sistema operacional ou aplicativos), não precisará mover tudo, exceto os dados do usuário.

Em vez de procurar apenas partes de informações de smartctl , use -a . Ele também inclui todas as informações que você forneceu mais o log de erros.

    
por 25.11.2017 / 21:18
0

Recentemente, um disco rígido falhou em um teste SMART em mim. Ele nem sequer apareceu como PASSED, mas disse FAILED em vez disso. O disco rígido continua funcionando, então se o seu diz PASSADO, certamente será OK

    
por 25.11.2017 / 01:06