Estamos planejando comprar um cluster para cálculos científicos, atualmente, estamos no processo de reunir as especificações. Não temos certeza, quais devem ser as especificações do servidor de armazenamento .
O próprio cluster conterá ~ 200 nós computacionais conectados por uma rede de baixa latência (para cálculos paralelos) e será usado por aprox. 25 usuários.
O armazenamento terá aprox. 200 TB de espaço utilizável e será usado para executar as computações (nós computacionais não terão discos) e não deve servir como backup de dados (ou seja, não exigimos proteção contra perda de dados de nível industrial).
Eu tenho o seguinte; comentários e sugestões são muito apreciados.
Especificações:
- Tecnologia ZFS para criar um único volume e proteger contra falhas de unidade
- use a configuração multi-pool da configuração RAID-Z2 ou RAID-Z3 com paridade de 25%, o que significa 8 discos por RAID-Z2 ou 12 discos por RAID-Z3.
- algum tipo de tecnologia de armazenamento em cache usando SSDs (para aumentar a velocidade de i / o de arquivos usados com frequência)
- 10 Gbit newtork (ou até 100 Gbit, se possível)
Perguntas e amp; Notas:
- Estamos preocupados com a velocidade de E / S, vários processos (25+) gravarão grandes quantidades de dados no armazenamento
- Nós não iremos ler / gravar um grande número de arquivos pequenos (isso não será permitido)
- Esperamos que os discos falhem durante o tempo de armazenamento (~ 5 anos), e não queremos perder dados, mas uma perda parcial de dados durante esse tempo (digamos uma vez) é aceitável - qual é a probabilidade com tais uma configuração?
- Quantas peças de reposição (em relação ao número total de discos) devemos solicitar?
- Eu realmente não sei, que tipo de tecnologia de armazenamento em cache (se houver) está disponível
- Os componentes do cluster serão operados pelo linux
Editar:
Note que não estou procurando conselhos sobre especificações de hardware - minhas perguntas são principalmente direcionadas a qual comportamento devo esperar ao usar a configuração especificada do ZFS (RAID) . As especificações de hardware estão aqui apenas para especificar o tamanho do meu sistema.