Você não faz.
Você compra outro disco para substituí-lo, a menos que realmente goste de perder dados.
Após 3 anos em serviço 24x7, um disco corporativo Seagate Barracuda ES.2 de 1TB está mostrando sinais de falha. INTELIGENTE. a contagem de setores realocados é alta.
O artigo artigo sugere que a unidade ainda pode ser usada para fins menos confidenciais, como armazenamento temporário fora de uma matriz, se for remapeada setores são deixados sem uso.
A workaround which will preserve drive speed at the expense of capacity
is to create a disk partition over the region which contains remaps and
instruct the operating system to not use that partition.
Para criar essa partição, é necessário buscar a lista de setores remapeados. No entanto, não há badblocks visíveis para o sistema operacional. Ou seja badblocks
retorna uma lista vazia.
Existe uma maneira de recuperar a lista de setores realocados?
Editar: Esta unidade é de uma matriz. Nós temos alguns deles falhando a cada ano e apenas jogá-los fora parece ser um desperdício. Estou pensando em dar uma segunda chance para as melhores partes dos pratos.
Aqui está como o S.M.A.R.T. relatório parece agora.
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda ES.2
Device Model: ST31000340NS
Serial Number: **********
Firmware Version: SN05
...
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 056 054 044 Pre-fail Always - 164293299
3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 14
5 Reallocated_Sector_Ct 0x0033 005 005 036 Pre-fail Always FAILING_NOW 1955
7 Seek_Error_Rate 0x000f 076 060 030 Pre-fail Always - 8677183434
9 Power_On_Hours 0x0032 072 072 000 Old_age Always - 24893
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 037 020 Old_age Always - 14
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 097 097 000 Old_age Always - 3
190 Airflow_Temperature_Cel 0x0022 050 043 045 Old_age Always In_the_past 50 (0 6 50 32)
194 Temperature_Celsius 0x0022 050 057 000 Old_age Always - 50 (0 18 0 0)
195 Hardware_ECC_Recovered 0x001a 021 010 000 Old_age Always - 164293299
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 21
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 21
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
Eu gostaria de agradecer o conselho e compartilhar alguns detalhes dos experimentos.
Em suma, não há maneira fácil de obter a lista de setores realocados e até mesmo os métodos estatísticos de mapeamento do disco são strongmente sobrecarregados pela necessidade de jogar contra a lógica do firmware.
Para testar a unidade, executei badblocks -wv
com o tamanho padrão do bloco e monitorei a contagem do setor realocado no processo. Eu fiz várias observações.
Eu observei que houve um aumento acentuado no número de setores realocados ao gravar no início do disco. Então, do primeiro 10G para o 700G, não houve mudança. Isso pode ser explicado pelo fato de que certos dados de armazenamento do RAID foram armazenados no início do disco, portanto, o desgaste na área de endereços pequenos foi maior do que no restante do disco.
Depois de um único erro, o disco se transformou em um modo bloqueado. Esse é todo comando ATA, até IDENTIFY DRIVE
retornou ABRT
. Embora o valor dos setores realocados ainda seja positivo. Para explicar esse comportamento como David Schwartz sugeriu, assumi que os setores reservados são de alguma forma distribuídos sobre o espaço de endereço da unidade. Isso significa que a unidade pode ter setores reservados, mas uma parte dela pode ficar sem setores para remapear. Nesta situação, o firmware apenas bloqueia a unidade.
O inversor só retorna do modo bloqueado após energizar o inversor. Quando as unidades antigas permitem que o software monitore os blocos defeituosos e evite usá-los, as unidades modernas não oferecem essa oportunidade. Quando o firmware pensa que não consegue lidar com os erros, isso torna a unidade inutilizável.
Ao executar o valor de setores realocados até 02, concluo que há 2048 setores reservados nessa unidade.
A chamada formatação de baixo nível, ou a gravação de zeros em todos os setores acessíveis da unidade para realocar os setores de partes menos confiáveis do disco, não funcionaria porque, quando a unidade fica sem setores reservados, ela muda a maneira Ele lida com erros de uma maneira que o torna muito menos conveniente de usar do que uma unidade tradicional que não faz nenhuma análise preditiva de falhas e simplesmente relata um erro.
Se você tiver dados de negócios que valham menos do que o custo da unidade, use-os para isso, caso contrário, jogue-os fora ou entregue a pessoas do departamento que entendam os riscos. Entre em contato com o fabricante e veja se eles oferecem reciclagem.
Se a unidade ainda estiver na garantia, você poderá devolvê-la ao fabricante por meio de seu processo de RMA para uma substituição gratuita, após sanitizá-la primeiro. (O Secure Erase limpará toda a unidade, incluindo setores realocados ou inacessíveis.) (Estou surpreso que ninguém tenha sugerido isso.) Caso contrário, você faz o que o @SpacemanSpiff disse e comprará uma nova unidade.
na verdade, um apagamento seguro aprimorado é melhor, já que também abrange os blocos reservados.
No entanto: Se realmente existem muitos setores defeituosos, o disco é um peso de papel. Ditto se não os realocar ou declarar ok (setores pendentes ocorrem quando há um problema de leitura. A maioria deles são erros "soft", geralmente causados por vibração externa).
Eu tive muitas unidades como essa, mas com as ferramentas da manufatura depois de mudar a posição inicial, se é onde a maioria dos setores defeituosos estão e tirar 5-10% da capacidade da unidade. Se for um controlador e software decente, ele usará os não alocados como sobressalentes. Eu corri um corte WD 1800 para 160 GB por 5 anos sem problemas até que o controlador foi incendiado por uma fonte de alimentação ruim. No momento, estou usando um Samsung similarmente para tampas de TV, removi 100 GB de um 2 TB, mais erros em um fluxo de transporte do que uma unidade esperaria de apresentar, portanto, isso não é um problema por enquanto.
As ferramentas Hitachi, Samsung e WD llf parecem fazer um bom trabalho de remapeamento, ainda não conhecem a Seagate, pois ou entraram em desuso ou sofreram uma falha catastrófica imediata.
* Fazer essas coisas é muito mais fácil agora com o último disco de inicialização.
Se você realmente quiser arriscar seus dados neste disco (eu não faria isso), use dd
para gravar o disco inteiramente em zeros.
dd if=/dev/zero of=/dev/sdX
Isso fará com que a unidade realoque os setores pendentes e toda a superfície do disco será utilizável. Por um tempo; -)
Tags hard-drive smart bad-blocks