Quais são as armadilhas de ter um RAID1 “desequilibrado”?

1

Contexto: Eu tenho um servidor com duas unidades NAS de 3TB em um RAID1 (Linux dmraid) e estou procurando duplicar a capacidade de armazenamento, mas só tenho um compartimento de unidade livre. Eu poderia comprar duas unidades de 6 TB, mas pensei que poderia comprar apenas uma e remodelar a matriz para:

  • 6 TB RAID1
    • disco de 6 TB (novo)
    • 6 TB RAID0
      • disco de 3 TB (existente)
      • disco de 3 TB (existente)

Não estou preocupado com o processo de reformulação, pois isso deve ser bastante simples:

  1. Faça backup do conteúdo, é claro.
  2. Cresça o RAID1 existente para 3 dispositivos adicionando o disco de 6 TB.
  3. Aguarde a sincronização da sincronização.
  4. Falha dos dois dispositivos de 3 TB fora do array. (Array se torna degradado).
  5. Reduza o array para dois dispositivos.
  6. Crie o RAID0 nos dois dispositivos de 3 TB.
  7. Adicione o RAID0 como o segundo dispositivo ao RAID1.
  8. O RAID1 é ressincronizado e não está mais degradado.
  9. Redimensione o RAID1, aumentando de 3 TB para 6 TB.

Isso tudo deve ser factível on-line.

No entanto, quero ter certeza de que isso é sane. Todas as unidades seriam do mesmo fabricante e série (WD Red). O desempenho é menos uma preocupação para mim do que a confiabilidade.

Quais problemas eu posso encontrar operando e mantendo tal matriz? (Eu não estou perguntando sobre o processo de migração / remodelação; estou muito confortável com esse procedimento.)

Haveria uma vantagem de desempenho ou confiabilidade em ter o dispositivo RAID1 (o disco de 6TB ou o 3TB + 3TB RAID0) sinalizado como gravação principalmente? Por exemplo, como o RAID0 contém unidades mais antigas, a maioria das unidades gravaria no dispositivo RAID0 para prolongar a vida útil dessas unidades?

    
por cdhowie 11.09.2018 / 04:36

2 respostas

1

tl: dr: Certifique-se de que essas unidades menores sejam extremamente confiáveis.

Você estaria fazendo como o antigo metadado SunOS, com upgrades interessantes, quando as unidades SCSI fossem proibitivamente. Se as unidades são do mesmo mfgr tem pouco ou nenhum impacto sobre o que o sistema operacional se preocupa. É bom padronizar em um modelo exato, origem de fábrica e placa rev, pois as placas do controlador podem ser trocadas se uma placa for removida. (Se você tem uma caixa limpa como Louis Rossmann, você pode até mesmo trocar os pratos entre as unidades.)

Pf = probabilidade de falha

D # = número do disco #

A confiabilidade do RAID0 é Pf (D0) * Pf (D1)

A confiabilidade do RAID1 é 1 - (1 - Pf (D0)) * (1 - Pf (D1))

Que leva a um total Pf = 1 - (1 - Pf (D0)) * (1 - Pf (D10) * Pf (D11))

Para referência futura, confira o blog do BackBlaze para obter modelos de unidades atuais e muito confiáveis, a fim de obter unidades de qualidade relativamente baratas e ficar longe de unidades problemáticas. Há "consumidor de varejo" dirige por aí com MTTF / MTBF comprovadamente melhores do que os drives corporativos, e eles são muito mais baratos também.

Referências

link

link

    
por 11.09.2018 / 08:27
1

O que você está fazendo é exatamente o que fizemos em nossa (pequena) empresa. Aumentamos o tamanho de nosso array RAID1 de 1TB inicial para 4TB similarmente ao que você está descrevendo, inicialmente comprando um drive maior ou dois, e então completando o novo grande array com drives maiores, já que alguns dos menores foram removidos do drive array por causa de uma falha, ou porque eles eram necessários para substituir outras unidades (ainda menores) que falharam em outros PCs da empresa.

Não estamos muito preocupados com o desempenho e vimos um desempenho diferente durante esses anos, por isso não posso falar sobre isso.

Estamos mais preocupados com a confiabilidade (como você), e posso dizer que nossa matriz RAID é uma matriz 3-RAID1, além de uma reserva externa que é ressincronizada a cada dia e trocada por uma das unidades 3-RAID1 . A reserva externa é para recuperação de desastres: no caso de algum evento destruir todas as unidades da matriz, podemos começar imediatamente com os dados do dia anterior.

Com um RAID1 de 2 unidades, você precisa se preocupar com o tempo de ressincronização necessário ao instalar uma nova unidade para substituir uma que falhou, o que pode levar várias horas para uma matriz de 6 TB. Você fica com a confiabilidade de uma única unidade sozinha durante essas horas. Com essas grandes unidades, acho que é melhor ter pelo menos um RAID1 de 3 unidades.

    
por 28.09.2018 / 09:43