HDD Falha no RAID, mas verifica bem?

1

Eu tive uma falha no HDD no meu Linux RAID (luz vermelha piscando). Eu puxei para fora e na reinicialização fui forçado a executar o fsck manualmente e reparar alguns erros no sistema de arquivos restante.

Eu estava tentando descobrir algumas informações adicionais sobre o motivo da falha e conectei-o ao meu PC com Windows. Quando liguei, recebi uma mensagem para inicializá-lo no gerenciador de disco. Eu estava planejando usar CrystalDiskInfo ou HDTune para obter o S.M.A.R.T. dados. Ele apareceu em verde, mas tem uma contagem de 1 em "Erros não corrigidos relatados". Eu decidi formatá-lo para obter mais informações. Eu fiz o formato completo, não rápido e não recebi nenhum erro.

Eu então carreguei o HDTune e fiz uma varredura de preenchimento, mas não encontrei nenhum problema. Eu sei que esse passeio tem muitas horas, mas estou mais interessado no assunto principal. Ignorando as horas, por que essa unidade falharia no RAID, mas operaria normalmente?

Após essas varreduras, existe uma razão para não devolvê-lo ao serviço?

    
por Alan 19.12.2017 / 23:24

1 resposta

2

Os dados SMART contêm muitas informações proprietárias que podem ser difíceis de decifrar. O problema com os dados SMART é que, a menos que haja algo "sinalizado", é quase impossível saber realmente o que realmente está acontecendo com a unidade.

Uma unidade com falha não significa necessariamente que ela tenha um status SMART com defeito.

O mais provável é que a unidade esteja começando a exibir setores defeituosos que estão sendo realocados e que estão causando problemas de tempo em seu RAID. Ou há outros problemas que o driver RAID está detectando - como falhas de leitura, falhas de gravação ou longos tempos de acesso / busca.

Para responder à sua pergunta, NÃO, a unidade não deve ser confiável e não deve ser retornada ao serviço. Eu pessoalmente já vi esse mesmo comportamento muitas vezes, e toda vez que eu devolvia o carro para o serviço, ele era expulso novamente dentro de alguns meses. Eu não faço mais isso.

Ignorando qualquer possibilidade de problema de fiação ou problema no controlador RAID / SATA, a unidade está sendo expulsa porque está com problemas. As unidades são baratas e, sendo o RAID frequentemente usado em sistemas de produção, não vale a pena correr o risco de perder duas ou mais unidades e seus dados.

    
por 20.12.2017 / 02:10