Normalmente, o que você quer é um pacote chamado smartmontools. Pode consultar a interface SMART nos seus discos, que é na maioria dos discos modernos.
Existe um daemon chamado smartd que pode ajudá-lo com monitoramento contínuo.
No entanto, se o seu sistema for um servidor doméstico, apenas verificar manualmente é sempre melhor. Assim:
smartctl -a / dev / sda
Muitos dados são divulgados. As coisas que mais me interessam são as seguintes:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 100 051 Pre-fail Always - 0
9 Power_On_Hours 0x0032 097 097 000 Old_age Always - 13946
13 Read_Soft_Error_Rate 0x000e 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 075 066 000 Old_age Always - 25
194 Temperature_Celsius 0x0022 075 064 000 Old_age Always - 25
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x003e 100 100 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x000a 100 100 000 Old_age Always - 0
201 Soft_Read_Error_Rate 0x000a 100 100 000 Old_age Always - 0
Isso lhe dá uma maneira de medir a saúde da unidade subjetivamente. Quando a taxa de erro começa a subir, é hora de procurar uma substituição. Além disso, você pode verificar se eles não estão funcionando bem.