O controlador RAID diz que a unidade falhou, outro computador diz que é saudável

0

Eu tenho um servidor doméstico com as seguintes especificações:

  • Servidor Lenovo TS140
  • Controlador RAID IBM ServeRAID M5015
  • 4 unidades WD Red 4 TB (WD40EFRX) no RAID 10
  • Cabo 3WARE SFF-8087 (CBL-SFF8087OCF-05M) conectando as unidades ao controlador RAID

Recentemente, tive uma falha na unidade (após cerca de 8 meses de uso), por isso, recebi a unidade de RMA, recebi a unidade de substituição e reconstruí a matriz com êxito. 24 horas depois, o controlador informou que a unidade de substituição falhou, então eu enviei outra RMA. Acabei de receber a nova substituição e, assim que insiro a unidade ou tento reconstruir a matriz, o alarme do controlador se apaga e mostra a nova unidade de substituição como falha.

O curioso é que, se eu tirar a unidade do servidor e jogá-la no computador de mesa, poderei formatar e usar a unidade sem problemas. Executando um programa que pode ler S.M.A.R.T. dados (CrystalDiskInfo), a unidade mostra como estando em "bom" saúde.

Infelizmente, não tenho muita experiência com o RAID, por isso não sei ao certo qual é o problema aqui. Devo apenas tentar enviar a unidade de volta para outro RMA? Poderia ser o cabo SFF-8087 que está falhando? Ou há mais alguma coisa que eu possa fazer para ter mais informações sobre o que pode estar causando esse problema?

Aqui está uma captura de tela mostrando os dados SMART da unidade:

EutambémexecuteiosAutotestesdeDisco(curtoseestendidos)noPassMarkDiskCheckupenoWesternDigitalDataLifeGuardDiagnostics.Todosostestesforamaprovados:

    
por n110 09.08.2016 / 01:14

1 resposta

1

Controladores diferentes têm critérios diferentes em relação a se uma unidade é saudável o suficiente para isso ou não. Alguns controladores até se recusam a obter uma nova unidade, a menos que você reconstrua a matriz inteira.

Execute o WD Data Lifeguard Diagnostic e veja se a unidade passa tanto pelo modo rápido quanto pelo estendido testes. Você pode até fazer isso com todas as unidades. Isso deve mostrar se as unidades estão saudáveis ou não. Você também pode tentar preencher o novo substituto WD Red com zeros (preenchimento completo) com a ferramenta e ver se isso resolveu o problema com o controlador.

Verifique os valores brutos do S.M.A.R.T. status como eles podem lhe dar informações mais precisas sobre a condição da unidade.

Você poderia postar uma captura de tela do teste que você fez?

    
por 09.08.2016 / 09:13