Devo 'executar' um disco de um novo par RAID 1 para diminuir a chance de um tempo de falha similar?

19

Estou configurando uma matriz RAID1 de dois novos discos rígidos de 4 TB.

Eu ouvi em algum lugar anteriormente, que fazer uma matriz RAID1 de novos discos rígidos idênticos ser comprada ao mesmo tempo aumentava a chance de que eles falhassem em um ponto similar no tempo.

Por isso, estou pensando em usar um dos discos rígidos por um período de tempo (talvez um par de semanas) por conta própria, em uma tentativa de reduzir a probabilidade de ambos falharem dentro de um curto período de tempo. (a unidade não usada seria mantida desconectada em uma gaveta)

Isso parece uma abordagem razoável, ou estou mais propenso a desperdiçar meu tempo?

    
por a_henderson 17.03.2015 / 13:45

6 respostas

16

É uma perda de tempo.

Você não será capaz de induzir falhas ou sobrecarregar as unidades de maneira significativa. Você tem RAID e isso é um bom começo. Apenas certifique-se de ter o monitoramento em vigor para detectar as falhas à medida que elas ocorrem e os backups para proteger contra desastres.

    
por 17.03.2015 / 14:00
5

Pode ser melhor usar marcas diferentes ou séries de discos juntos se você estiver preocupado com isso.

Eu tenho visto discos de tipo e idade semelhantes falharem em clusters, então IMHO não é um empréstimo urbano.

    
por 17.03.2015 / 14:27
2

Grande pergunta - No entanto, ao contrário dos faróis de automóveis, isso é uma perda de tempo. A classificação MTBF [tempo médio entre falhas] para unidades de 4 GB [WD Red neste exemplo] é de 1.000.000 horas. A probabilidade de duas unidades ficarem ruins em um espelho ao mesmo tempo é extremamente rara. Quando vi isso acontecer, foi porque o primeiro disco falhou sem que ninguém percebesse. Mais útil para proteger com backups do que se preocupar em gravar em uma unidade primeiro. Se você misturar os tipos de drive, certifique-se de que os drives tenham a mesma velocidade. Se você é paranóico, o RAID 10 é para você.

    
por 17.03.2015 / 22:00
1

Embora faça sentido em teoria, os dados não suportam a necessidade de work in de sua unidade.
Não apenas algumas semanas realmente não causarão impacto, mas as porcentagens de falhas não funcionam quando se olha apenas para duas unidades.

Embora tenha havido alguma indicação de mais taxas de falhas normalizadas quando se trata de unidades do mesmo modelo.

Most age-related results are impacted by drive vintages... Interestingly, this does not change our conclusions. In contrast to age-related results, we note that all results shown in the rest of the paper are not affected significantly by the population mix. (emphasis mine)

Como tal, as falhas relacionadas à idade, que são apenas um pequeno subconjunto de falhas, podem ser correlacionadas de alguma forma para impulsionar as safras. Mas a maioria dos fracassos não pode.
Se adicionarmos a isso as porcentagens gerais de falhas, que podem chegar a 8% em um determinado ano, as chances de ambas as unidades falharem no mesmo ano são pequenas, e as falhas na mesma semana são insignificantes. E isso é se você olhar para todas as possíveis causas de falha, não apenas falhas relacionadas à idade.

Se você quiser minimizar o risco, mas duas unidades de uma safra diferente.
Se você quer garantias, compre um seguro.
E como a resposta ewwhite já mencionada, os backups e o monitoramento são obrigatórios.

    
por 19.03.2015 / 11:01
0

Este é geralmente um argumento para SSDs mais do que HDDs na minha experiência. Os SSDs têm ciclos de gravação limitados, portanto, se você usar um RAID1 com dois SSDs do mesmo modelo, ambos deverão ficar sem ciclos de gravação próximos ao mesmo tempo.

Quanto a falhas gerais, a menos que você tenha um problema sério, como vibração em massa, estática ou alta temperatura; Não suspeito que você verá que 2 de 2 unidades falham ao mesmo tempo.

Uma preocupação principal com RAID1 (e RAID10) com unidades maiores como 4TB é a reconstrução. Com um espelho de 2 unidades, quando uma unidade falha, a outra unidade carrega duas vezes a carga de trabalho. Então, quando você reconstruir, essa unidade estará recebendo ainda mais carga. Se houver algo errado com essa unidade, é provável que ela falhe nessas condições, especialmente considerando que a reconstrução de um espelho de 4 TB sob carga pode demorar muito.

    
por 18.03.2015 / 01:24
0

Você pode fazer, mas não vai ajudar muito.

Por exemplo, se houver uma agulha na potência de entrada, a mesma agulha matará os dois discos.

O que é importante: você precisa ter um bom backup. Raid não compensa um bom backup. Na verdade, se você tiver um bom backup, talvez uma invasão de espelhamento não seja necessária (se você puder tolerar um colapso do sistema uma vez em torno de 2 a 3 anos).

    
por 18.03.2015 / 06:11