você precisará de uma combinação de ferramentas, que acredito que estão agrupadas no pacote smartmontools. Esses links contêm um plano bastante interessante.
Seu primeiro passo deve ser avaliar o relatório SMART de cada unidade
usando smartctl. smartctl -a /dev/sdX
assumindo um padrão SATA
controlador, com X sendo o identificador de unidade real
Seu segundo passo deve ser um autoteste de drive estendido, smartctl é
o caminho a seguir também: smartctl --test=long /dev/sdX
e depois
o tempo de teste passou (entre 60 e 240 minutos para a maioria das unidades),
leia os resultados com o comando no passo 1.
O seu terceiro passo deve ser um teste de condução, se suportado por
sua unidade. Você recebe um erro do seguinte comando, se não for
suportado: smartctl --test=conveyance /dev/sdX
. Resultados: veja o passo 1.
Até esse ponto, simplesmente escrever toda a unidade seria ruim
idéia, uma vez que os remapeamentos ruins do setor são feitos durante as operações de gravação. Dentro
Em outras palavras, a evidência da falha da unidade pode ter sido coberta
para cima.
Supondo que todas as etapas acima não consigam encontrar um problema, você deve agora
use "badblocks" para verificar suas unidades em busca de erros de gravação:
badblocks -nvs /dev/sdX
O acima é um teste não destrutivo, use -wvs é o destrutivo
alternativa, pode ser um pouco mais rápido.
Os que eu presto atenção no meu laptop (com unidade SSD, discos diferentes têm diferentes testes S.M.A.R.T.)
5 Reallocated_Sector_Ct
183 Runtime_Bad_Block
184 End-to-End_Error
233 Media_Wearout_Indicator
Especialmente o primeiro indicador é bom, já que ele informa quantos setores / blocos defeituosos foram remapeados no disco.