como usar um disco com alta contagem de setores realocados?

7

Após 3 anos em serviço 24x7, um disco corporativo Seagate Barracuda ES.2 de 1TB está mostrando sinais de falha. INTELIGENTE. a contagem de setores realocados é alta.

O artigo artigo sugere que a unidade ainda pode ser usada para fins menos confidenciais, como armazenamento temporário fora de uma matriz, se for remapeada setores são deixados sem uso.

A workaround which will preserve drive speed at the expense of capacity 
is to create a disk partition over the region which contains remaps and 
instruct the operating system to not use that partition.

Para criar essa partição, é necessário buscar a lista de setores remapeados. No entanto, não há badblocks visíveis para o sistema operacional. Ou seja badblocks retorna uma lista vazia.

Existe uma maneira de recuperar a lista de setores realocados?

Editar: Esta unidade é de uma matriz. Nós temos alguns deles falhando a cada ano e apenas jogá-los fora parece ser um desperdício. Estou pensando em dar uma segunda chance para as melhores partes dos pratos.

Aqui está como o S.M.A.R.T. relatório parece agora.

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda ES.2
Device Model:     ST31000340NS
Serial Number:    **********
Firmware Version: SN05
...
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   056   054   044    Pre-fail  Always       -       164293299
  3 Spin_Up_Time            0x0003   099   099   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       14
  5 Reallocated_Sector_Ct   0x0033   005   005   036    Pre-fail  Always   FAILING_NOW 1955
  7 Seek_Error_Rate         0x000f   076   060   030    Pre-fail  Always       -       8677183434
  9 Power_On_Hours          0x0032   072   072   000    Old_age   Always       -       24893
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   037   020    Old_age   Always       -       14
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   097   097   000    Old_age   Always       -       3
190 Airflow_Temperature_Cel 0x0022   050   043   045    Old_age   Always   In_the_past 50 (0 6 50 32)
194 Temperature_Celsius     0x0022   050   057   000    Old_age   Always       -       50 (0 18 0 0)
195 Hardware_ECC_Recovered  0x001a   021   010   000    Old_age   Always       -       164293299
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       21
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       21
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
    
por Dmitri Chubarov 10.05.2012 / 07:04

7 respostas

16

Você não faz.

Você compra outro disco para substituí-lo, a menos que realmente goste de perder dados.

    
por 10.05.2012 / 07:09
12

Eu gostaria de agradecer o conselho e compartilhar alguns detalhes dos experimentos.

Em suma, não há maneira fácil de obter a lista de setores realocados e até mesmo os métodos estatísticos de mapeamento do disco são strongmente sobrecarregados pela necessidade de jogar contra a lógica do firmware.

Para testar a unidade, executei badblocks -wv com o tamanho padrão do bloco e monitorei a contagem do setor realocado no processo. Eu fiz várias observações.

  1. Eu observei que houve um aumento acentuado no número de setores realocados ao gravar no início do disco. Então, do primeiro 10G para o 700G, não houve mudança. Isso pode ser explicado pelo fato de que certos dados de armazenamento do RAID foram armazenados no início do disco, portanto, o desgaste na área de endereços pequenos foi maior do que no restante do disco.

  2. Depois de um único erro, o disco se transformou em um modo bloqueado. Esse é todo comando ATA, até IDENTIFY DRIVE retornou ABRT . Embora o valor dos setores realocados ainda seja positivo. Para explicar esse comportamento como David Schwartz sugeriu, assumi que os setores reservados são de alguma forma distribuídos sobre o espaço de endereço da unidade. Isso significa que a unidade pode ter setores reservados, mas uma parte dela pode ficar sem setores para remapear. Nesta situação, o firmware apenas bloqueia a unidade.

  3. O inversor só retorna do modo bloqueado após energizar o inversor. Quando as unidades antigas permitem que o software monitore os blocos defeituosos e evite usá-los, as unidades modernas não oferecem essa oportunidade. Quando o firmware pensa que não consegue lidar com os erros, isso torna a unidade inutilizável.

  4. Ao executar o valor de setores realocados até 02, concluo que há 2048 setores reservados nessa unidade.

  5. A chamada formatação de baixo nível, ou a gravação de zeros em todos os setores acessíveis da unidade para realocar os setores de partes menos confiáveis do disco, não funcionaria porque, quando a unidade fica sem setores reservados, ela muda a maneira Ele lida com erros de uma maneira que o torna muito menos conveniente de usar do que uma unidade tradicional que não faz nenhuma análise preditiva de falhas e simplesmente relata um erro.

por 11.05.2012 / 20:51
3

Se você tiver dados de negócios que valham menos do que o custo da unidade, use-os para isso, caso contrário, jogue-os fora ou entregue a pessoas do departamento que entendam os riscos. Entre em contato com o fabricante e veja se eles oferecem reciclagem.

    
por 10.05.2012 / 08:45
3

Se a unidade ainda estiver na garantia, você poderá devolvê-la ao fabricante por meio de seu processo de RMA para uma substituição gratuita, após sanitizá-la primeiro. (O Secure Erase limpará toda a unidade, incluindo setores realocados ou inacessíveis.) (Estou surpreso que ninguém tenha sugerido isso.) Caso contrário, você faz o que o @SpacemanSpiff disse e comprará uma nova unidade.

    
por 26.08.2012 / 02:49
1

na verdade, um apagamento seguro aprimorado é melhor, já que também abrange os blocos reservados.

No entanto: Se realmente existem muitos setores defeituosos, o disco é um peso de papel. Ditto se não os realocar ou declarar ok (setores pendentes ocorrem quando há um problema de leitura. A maioria deles são erros "soft", geralmente causados por vibração externa).

    
por 19.12.2012 / 20:38
1

Eu tive muitas unidades como essa, mas com as ferramentas da manufatura depois de mudar a posição inicial, se é onde a maioria dos setores defeituosos estão e tirar 5-10% da capacidade da unidade. Se for um controlador e software decente, ele usará os não alocados como sobressalentes. Eu corri um corte WD 1800 para 160 GB por 5 anos sem problemas até que o controlador foi incendiado por uma fonte de alimentação ruim. No momento, estou usando um Samsung similarmente para tampas de TV, removi 100 GB de um 2 TB, mais erros em um fluxo de transporte do que uma unidade esperaria de apresentar, portanto, isso não é um problema por enquanto.

As ferramentas Hitachi, Samsung e WD llf parecem fazer um bom trabalho de remapeamento, ainda não conhecem a Seagate, pois ou entraram em desuso ou sofreram uma falha catastrófica imediata.

* Fazer essas coisas é muito mais fácil agora com o último disco de inicialização.

    
por 29.12.2012 / 11:04
-1

Se você realmente quiser arriscar seus dados neste disco (eu não faria isso), use dd para gravar o disco inteiramente em zeros.

dd if=/dev/zero of=/dev/sdX

Isso fará com que a unidade realoque os setores pendentes e toda a superfície do disco será utilizável. Por um tempo; -)

    
por 10.05.2012 / 20:41