Se um disco rígido desenvolve um setor defeituoso, ele deve ser substituído?

4

Recentemente, encontrei um erro de E / S lendo um arquivo no meu disco rígido. O exame dos dados do SMART mostra que a unidade possui um setor defeituoso (a contagem Current_Pending_Sector é 1). O arquivo foi criado recentemente (algumas horas atrás), portanto, essa falha deve ser bem recente.

Uma opção é substituir imediatamente a unidade. Outra é simplesmente recuperar o arquivo ilegível dos backups; reescrevendo o setor fará com que seja remapeado para um setor físico diferente. Isso economizaria a despesa e o incômodo de substituir a unidade. Mas se o setor ruim sugerir que um novo fracasso provavelmente acontecerá em breve, isso apenas adia o inevitável.

A aparência de uma única evidência de setor defeituoso é que a unidade está falhando e precisa ser substituída?

Em outras palavras, imagine que eu tenho dois discos rígidos idênticos. A unidade A tem 0 setores defeituosos. A unidade B acaba de desenvolver um setor ruim. O Drive B é significativamente mais provável do que o Drive A para desenvolver outros setores defeituosos, ou falhar de alguma outra forma séria, no futuro próximo?

Se possível, gostaria de ver as respostas suportadas por dados ou estatísticas em grande escala , em vez de opinião ou anedota. Há muita pseudociência e desinformação por aí com relação à falha no disco rígido, por isso quero ter certeza de basear minha decisão em fatos.

Meu entendimento é que um "setor defeituoso" significa que um determinado setor no disco não pode ser lido pelo hardware de maneira sensata ou contém dados que não correspondem à soma de verificação armazenada na unidade. Então, por qualquer motivo, o setor efetivamente não contém mais os dados originalmente escritos lá. Eu posso imaginar várias causas possíveis para tal falha; alguns deles sugerem que a falha provavelmente progredirá e outros não. Talvez um raio cósmico tenha virado alguns pedaços naquele setor; Nesse caso, a falha foi totalmente aleatória, e não há razão para pensar que essa unidade seja mais propensa a sofrer mais falhas do que uma nova unidade seria. Ou talvez haja um minúsculo verme mastigando os domínios magnéticos no disco; acabou de comer um setor e agora vai comer um pouco mais, portanto, mais perda de dados é iminente. :-) Na prática, um cenário é muito mais prevalente que o outro?

Se for relevante, a unidade em questão é uma unidade magnética SATA de 2,5 "e 650 GB, vendida pela Samsung e tem cerca de 5 anos. O arquivo contendo o setor defeituoso foi criado há menos de um dia. O sistema operacional é Ubuntu 14.04 Todos os dados importantes são salvos em backup, portanto, uma falha na unidade significaria apenas comprar uma nova unidade em curto prazo, tempo de inatividade para substituir a unidade e talvez a perda de alguns dados muito recentes.O sistema é um servidor doméstico, portanto o tempo de inatividade é inconveniente, mas não seriamente caro.

    
por Nate Eldredge 18.10.2015 / 20:45

4 respostas

5

Com um único setor ruim e considerando a idade da unidade, eu ficaria preocupado; no entanto, você diz que não será um grande problema se ele falhar e você estiver seguindo uma boa estratégia de backup, então eu sinto que você está bem esperando que ele faça o que está certo.

Isso pode acontecer amanhã ou pode acontecer em 10 anos. Pode acontecer depois de desenvolver mais setores defeituosos ou nunca acontecer. Você menciona raios cósmicos - isso é exatamente a coisa - poderia ter sido qualquer coisa que fez o setor ficar ruim. Deixe o disco rígido e o SO marcarem o setor como algo ruim e continuar fazendo o que você está fazendo no que diz respeito a backups. Quando você tiver tempo e recursos para substituir a unidade, faça isso, mas eu não me preocuparia em torná-la uma prioridade.

    
por 18.10.2015 / 21:53
3

Eu enfrentei esta situação. No caso de setores defeituosos depois de algum tempo você não será capaz de copiar dados de volta do disco que tem setor ruim.Depois de algum tempo você vai começar a enfrentar problemas de lentidão que acabarão por levar à queda de o sistema operacional.
Em suma, basta substituir a unidade e não arriscar seus dados.

    
por 18.10.2015 / 21:00
1

Eu sugiro manter um olho na contagem do setor ruim. Se permanecer o mesmo por um longo período, digamos um mês, então você está bem; o defeito foi provavelmente um problema de fabricação ou algum outro evento aleatório. No entanto, se a sua contagem do setor ruim continua a crescer, você definitivamente tem problemas e precisa substituir a unidade. Editando: Atualizando minha resposta para dizer que a unidade questionável deve ser verificada diariamente. Se depois de um mês não houver novos setores defeituosos, então a unidade está quase certa, mas se você vir novos todos os dias, a unidade precisa ser substituída o mais rápido possível. Você também precisa garantir que a unidade ou o computador esteja em uma superfície sólida que não seja facilmente empurrada.

    
por 18.10.2015 / 21:36
1

Eventualmente

No entanto, as unidades são projetadas para serem resilientes a setores defeituosos e muitas unidades continuam funcionando por um tempo com setores defeituosos. Sua unidade tem setores sobressalentes para lidar com esses problemas, e você precisa observar a grande figura ao decidir substituir sua unidade.

Eu estou supondo que você está olhando para dados inteligentes e syslog. Há erros específicos no último - isso indicaria o que exatamente está errado e seria útil aqui. Procure por erros corrigíveis relacionados à unidade (que são um pouco assustadores, mas não tanto) e incorrigíveis (que são um sinal de destruição iminente). Não me lembro dos erros no topo da minha cabeça.

O fato de que a contagem do setor pendente é preocupante. O setor deve ser substituído imediatamente. Eu também verificaria "Contagem de setor não corrigível" e qualquer outra coisa que fosse rosa aqui na página da Wikipédia sobre atributos inteligentes . Há também um atributo inteligente que mostra o número crescente de setores defeituosos. Abaixe o melhor lá, mas é um sinal de fracasso gradual em vez de cair morto.

Há alguns sinais de perigo aqui

  1. Os setores ainda não foram substituídos. Concedido é um número muito baixo e você deve ficar bem por um tempo

  2. O disco tem 5 anos. Está no final de um ciclo de garantia mais longo / ciclo de vida típico de design de computador.

Há algumas coisas que são reconfortantes. Você sabe que a unidade pode morrer a qualquer momento e ter backup e são preparados para perda de dados. Eu não diria que sair correndo e comprar uma unidade agora, mas seria prudente planejar uma unidade de substituição em breve . Você sempre pode usar a unidade antiga para dados transitórios até que ela morra.

    
por 19.10.2015 / 08:02