Configuração ideal de RAID 6 + 0 para mais de 40 discos de 4 TB

6

Estou configurando um JBOD contendo 44 HDs SAS de 4TB 7200 RPM. Eu escolhi o RAID 60 como eu prefiro a proteção de falha de unidade sobre as melhorias de desempenho oferecidas pelo RAID 10. Meu problema é como escolher os discos ideais por intervalo que resultaria em um tempo de reconstrução razoável. Por exemplo, supondo que eu deixe 4 hot-spares, isso resulta em 40 discos para as seguintes configurações possíveis de RAID:

  • 2 vãos com 20 discos, capacidade útil de 144 TB.
  • 4 extensões com 10 discos, capacidade útil de 128 TB.
  • 5 extensões com 8 discos, capacidade útil de 120 TB.
  • 8 extensões com 5 discos, capacidade útil de 96 TB.
Eu estou inclinado para 4 vãos de 10 discos, pois parece oferecer melhor equilíbrio de tolerância a falhas (2 de 10 falhas de drive por span tolerado) e capacidade utilizável (80%, abaixo de 90% para 2 vãos de 20 discos ).

No entanto, o que posso esperar que o tempo de reconstrução seja para um único intervalo de 10 discos? A pesquisa na Web revela que até mesmo um intervalo de 10 discos pode não ser viável, uma vez que a reconstrução pode demorar muito, por isso, corre o risco de falhas adicionais na unidade durante a reconstrução. No entanto, muitos recursos na Internet baseiam-se em menos discos ou em discos de menor capacidade.

Quaisquer pensamentos sobre qual é a configuração ideal para esse número relativamente grande de discos?

NOTA: Existe uma política de backup para cerca de 10 TB de dados, mas não é viável fazer backup de todos os dados. Daí minha inclinação para RAID 60 sobre RAID10. Percebo que isso não é um substituto para o backup, mas uma melhor recuperação da falha da unidade torna o sistema mais robusto, proporcionando oportunidade de reconstrução e, em seguida, migrando os dados para outro armazenamento caso ocorram várias falhas de disco.

EDIT: Especificações:

  • Discos: Seagate 4TB SAS 3,5 "HDD 7200 RPM, grau empresarial.
  • Controlador: Controlador ServerRAID M5016, incluindo chipset LSI2208 habilitado para RAID6. Consulte: link .
  • Gabinete: JBOD 45x3.5 de armazenamento Supermicro 4U com módulos de energia redundantes de 2x1400W.
  • SO: versão CentOS Linux 7.1.1503 (Core).

Obrigado pela ajuda.

    
por Vince 08.12.2017 / 17:13

4 respostas

1

Com modernos controladores RAID de hardware da Avago (LSI) ou Microsemi (Adaptec), os conjuntos RAID de 20 + 2 discos estão perfeitamente bem. O tempo de reconstrução é razoável (menos de 24 horas). As unidades atuais têm taxas de falha muito baixas, de qualquer forma. Eu definitivamente usaria 2 vãos.

    
por 14.12.2017 / 22:13
3

Com unidades de 4 TB de 7,2k, eu recomendo que as subarras sejam o menor possível - na verdade, 5 unidades não justificam o uso de RAID 6.

Meu 2c deve usar o RAID 10, onde você pode esperar que uma reconstrução termine dentro de 12 horas, o que um array RAID 6 de 20 TB de 5 unidades provavelmente não conseguirá.

Certifique-se de ativar a limpeza mensal de dados / media patrol / whatever-called-here para detectar erros de leitura antes que eles tenham a chance de interromper uma reconstrução. Na maioria das vezes, quando uma reconstrução falha, a causa não é uma unidade completamente defeituosa, mas um erro de leitura bastante antigo, mas não detectado, que poderia ter sido corrigido com uma limpeza regular.

    
por 10.12.2017 / 13:11
1

Com base em excelentes comentários recebidos, tentei um RAID60 que consiste em 5 vãos de 8 discos cada um, pelas seguintes razões:

  1. Com base na recente reconstrução que incluiu 2 vãos de 20 discos, eu estimo que o tempo de reconstrução para a configuração 8 + 2 seja razoável.

  2. A capacidade utilizável é reduzida marginalmente em comparação com extensões com maior número de discos (por exemplo, 10 ou 20 discos por intervalo). Embora a perda de 20 TB pareça considerável, o tamanho menor do span significa que a reconstrução será alcançável é um trade-off aceitável.

Eu atualizarei esta resposta com qualquer informação adicional que eu reunir.

Editar: Removido o RAID5 como opção viável.

    
por 13.12.2017 / 20:10
1

Em uma matriz tão grande, eu realmente usaria o RAID10, ou a configuração espelhada equivalente do ZFS. Você pode configurar um hot-spare global de 42 discos RAID10 + 2 (para espaço útil de 82 TB), e fornecerá excelente proteção contra falhas de disco com tempo de reconstrução muito rápido.

Se você realmente quiser usar o RAID6, eu me inclino em intervalos de 5x 10-discos.

    
por 15.12.2017 / 16:46

Tags