Falha no disco RAID - uma por dia (3ware 9650SE - Seagate Barracuda 3TB)

0

Eu tenho uma configuração RAID6, com placa 3ware 9650SE-8LPML e 6x Seagate Barracuda 3000GB funcionando a partir do início de 2012 (maio?). Aquele disco rígido era bem grande naquela época. Eles sempre faziam um barulho estranho quando procuravam por dados ou ligavam depois de um tempo, mas eu procurei na internet e algumas pessoas me disseram que era normal para esse disco rígido.

Um mês atrás, o controlador começou a notificar um problema na unidade com alguns setores danificados. Eu decidi remover a unidade e remapear o RAID6 com 6xdrives em vez de 7. Ontem, outra unidade começou a fazer um ruído continuamente alto, como se estivesse quebrado por dentro. Eu removi a unidade e substituí-lo com a unidade que eu removi há 1 mês, que não foi fisicamente danificado. O RAID recomeçou e hoje à noite tudo estava funcionando bem.

20 minutos atrás, outra unidade (não a que eu substituí ontem) começou a fazer o mesmo ruído que recebi ontem do disco rígido quebrado. O controlador RAID diz CONFIG FAILURE ao drive, ou simplesmente não mostra. Ambas as unidades (ontem e hoje) fazem este ruído apenas com o cabo SATA de alimentação e sem o cabo de sinal.

É possível que duas unidades estejam realmente quebradas?

É possível que o controlador RAID esteja quebrando as unidades?

Devo planejar substituir todas essas unidades nos próximos meses, porque elas estão chegando ao fim de suas vidas? Eu já comprei um novo 6 TB WD Red HDD. Se todas as unidades de 3TB precisarem ser substituídas em alguns meses, usarei os novos discos WDT de 6 TB como substitutos da antiga Seagate de 3TB usando apenas metade do espaço até que todas as unidades sejam substituídas ... Caso contrário, criarei uma nova RAID. É arriscado usar o novo WD RAID com este controlador?

Artigo muito interessante: LINK

    
por Perocat 26.08.2015 / 03:23

1 resposta

2

Existem vários fatores aqui.

  • Essas são unidades muito grandes. Há uma boa razão para não usar RAID5 (ou outros RAIDs de paridade) com arrays extremamente grandes: eles demoram um tempo longo para serem reconstruídos. O processo de reconstrução coloca muito mais estresse em todas as unidades restantes do que o normal, deixando uma chance muito alta de acionar outra falha. O RAID 6 é melhor que 5, mas ainda pode ter problemas como você vê aqui.

  • Essas unidades provavelmente são do mesmo lote. Normalmente, recomenda-se a obtenção de unidades de lotes diferentes, ou mesmo de diferentes idades, para escalonar falhas prováveis à medida que ocorrem.

  • Essas unidades específicas são notórias por extremamente alto taxas de falhas . Duas falhas de sete em dias consecutivos não são particularmente improváveis nesta idade para essas unidades!

Indo adiante, o que você deve fazer é:

  • Mantenha backups. Lembre-se que o RAID é imperfeito; os dados críticos devem sempre ter backups externos.

  • Tente comprar unidades que não sejam todas do mesmo lote. Isso reduz a probabilidade de falhas consecutivas.

  • Evite matrizes muito grandes. É melhor dividir em vários volumes lógicos, se possível, e talvez usar unidades físicas menores. Caso contrário, o RAID espelhado é melhor (reconstrução mais rápida) ao custo de mais espaço físico inutilizável.

por 26.08.2015 / 04:30