Smartmontools e discos rígidos de 3 TB

1

Eu tenho muitos drives de 3 TB, e em todos eles eles mostram o seguinte desde o início das ferramentas Smartmon.

Editar: Usando o Debian 6.0 / 7.0

Agora normalmente eu uso o Seek_Error_Rate ou CRC_ERROR_COUNT para dizer quando um disco rígido precisa ser substituído, no entanto, com estes, não há maneira de dizer (pelo que eu posso dizer).

Então, minha pergunta é: qual é a melhor maneira de saber quando uma unidade de 3TB está falhando? Existem outras ferramentas ou talvez alguma automação que eu possa configurar para me avisar com a maior brevidade? + em uso)

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   108   099   006    Pre-fail  Always       -       17853736
  3 Spin_Up_Time            0x0003   093   092   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       12
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   088   060   030    Pre-fail  Always       -       797480237
  9 Power_On_Hours          0x0032   091   091   000    Old_age   Always       -       8700
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       12
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   098   098   000    Old_age   Always       -       2
190 Airflow_Temperature_Cel 0x0022   070   062   045    Old_age   Always       -       30 (Lifetime Min/Max 29/31)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       10
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       82
194 Temperature_Celsius     0x0022   030   040   000    Old_age   Always       -       30 (0 23 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       1
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       269942989529561
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       155082501012819
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       221731329841837
    
por bhavicp 02.09.2013 / 22:16

1 resposta

1

Eu uso Reallocated_Sector_Ct para ver quando os discos estão morrendo. Isso mostra o número de blocos que o firmware de disco decidiu que não poderia mais ser usado, e um número diferente de zero indica que a superfície foi danificada e ocorreu perda de dados e, quando ela se torna diferente de zero, ela tende a aumentar. Spin_Retry_Count também é útil, um número diferente de zero significa que o disco teve que tentar girar novamente, possivelmente indicando uma falha iminente da unidade para ser iniciada. CRC_ERROR_COUNT está relacionado a falhas durante a comunicação com o controlador de disco, não erros internos à unidade e pode indicar problemas com o cabo ou com o controlador, e não com o disco. Seek_Error_Rate não pode ser interpretado de forma confiável.

Quanto ao monitoramento dos discos, o Smartmontools é fornecido com smartd , um daemon que pode ser executado em segundo plano e consultar periodicamente os dados do SMART.

    
por 03.09.2013 / 03:41

Tags