20 unidades de 1 TB em comparação com 10 unidades de 2 TB no servidor RAID5 / 6

2

Vou criar um servidor no trabalho e preciso de alguns conselhos sobre alguns detalhes. A configuração será um servidor do tipo blade (8-core, 16GB de RAM) com dois subsistemas - um para o armazenamento principal e outro para o backup. Estou fotografando para uma matriz de 20TB (sei que será menos após a formatação e as unidades de paridade).

Existe alguma vantagem de uma forma ou de outra com 20 unidades de 1 TB ou 10 unidades de 2 TB?

Eu não tenho certeza agora quantos controladores eu deveria ter (na citação que eu tenho é um controlador de porta dupla). Eu acho que dois controladores para um servidor deste tamanho seria uma escolha melhor do que o controlador de porta dupla (mas eu realmente não sei).

Um array desse tamanho teria problemas de desempenho no RAID 5 ou 6 (eu sei que o RAID 5 ou 6 são "mais lentos" por causa de todos os cálculos de paridade).

Além disso, eles serão WD RE3 (1TB) ou RE4 (2TB).

Ah, também, para o array de backup, seria correto usar as unidades verdes WD 2TB (também em RAID5 ou 6)?

    
por pauska 12.03.2010 / 09:58

7 respostas

4

20 unidades 1 TB - mais desempenho IO para pelo menos leitura (depende de como você as configura).

10 drives 2tb: menos desempenho de IO, problemas com qualidade de RAID 5 - vá para o RAID 6 para evitar problemas no caso de um disco falhar. Unidades de 2 TB são o limite para a reconstrução confiável.

I'm not sure right now how many controllers I should have either (in the quote I have is a dual-port controller).

Você deve optar por uma configuração do SAS. Seria ok para usar uma porta SAS, embora eu iria com uma gaiola de porta dupla e um controlador de porta dupla. Eu tenho uma configuração semelhante a essa (bem, menor, mais rápido) usando Velociraptors WD 300gb e uso um Adaptec 5805 e uma gaiola Supermicro com 24 slots em 1 rack unnits (2.5 "todos) e um backplane SAS para eles.

observe que o SAS pode manipular unidades SATA - elas são lógica e fisicamente compatíveis, basta conectá-las.

O Adaptec processa até cerca de 190 discos;) E tem bastante perforamcne de CPU para esse pequeno IO.

Oh, also, for the backup array would it be ok to use the WD 2TB green drives (also in RAID5 or 6)?

Backup - em geral, é mais lento. Então sim.

    
por 12.03.2010 / 10:09
2

Se você estiver usando o controlador para fazer o seu RAID, então ter dois controladores obviamente significará que você terá dois arranjos separados (ou seja, 2 x 10 discos ou 2 x 5 discos), se você estiver usando software RAID então isso não é um problema.

Também algo para estar ciente; 20 discos em um R6 config = 18 * (1000 * .95) = 17.1TB, Windows (você não menciona qual SO está usando) suportará volumes de 16TB com o maior tamanho de cluster, mas mais do que isso é 'não suportado 'na melhor das hipóteses, se é linux, então as coisas variam.

Agora, para a pergunta, e minha resposta se resume à importância dos dados que você está armazenando. Eu considero meu foco primário como a manutenção de dados existentes, todo o resto é secundário - com isso em mente eu ficaria tentado a optar por uma configuração de 20 x 2TB RAID 10 se você tiver o orçamento, se não o 10 x 2TB Configuração do RAID 6 e, por fim, o RAID de 20 x 1TB. Eu também me certificaria de ter algumas unidades sobressalentes por perto e garantir que meu alerta de falha na unidade estivesse funcionando bem.

Em relação ao backup, em seguida, para uso intermitente (ou seja, não-24/7), essas unidades verdes são adequadas.

    
por 12.03.2010 / 10:25
0

Tente ficar longe de discos RAID-5 e grandes (1 TB +). Eu me coloquei nessa armadilha e não vou esperar por uma falha na unidade antes de reformular meu ataque.

Como o Chopper disse, se você tiver o orçamento: Execute 20x1TB RAID10 ou com controladores duplos; 2x10x1TB. Isso lhe dará muito melhor velocidade de gravação, apesar de apenas 10 TB de armazenamento RAW.

Se você realmente precisa de 20 TB de armazenamento RAW, então eu rodaria 2x10x2TB em RAID10.

    
por 12.03.2010 / 10:48
0

Vinte discos em um ataque 5 ou 6 estão apenas pedindo problemas. A chance de falha em uma reconstrução é muito alta. Eu não iria além de oito drives em um Raid 6. Tome o tamanho do ataque, divida pela taxa de falha de bit dos discos e faça as contas.

Para saber mais sobre o Raid 5/6, consulte o link (página 8) ou similar papéis.

O caminho a seguir além de 10 TB é Raid 10. Sim, é muito menos eficiente na área espacial, mas é superior em desempenho e confiabilidade na reconstrução, porque apenas um espelhamento precisa ser reconstruído.

    
por 12.03.2010 / 11:11
0

Olhando para o lado da engenharia, supondo que eles sejam construídos da mesma forma, há uma maior probabilidade de os drives de maior capacidade gerarem problemas simplesmente porque tudo é muito mais crítico. Qualquer coisa que se mova deve resultar em desgaste. Quanto mais crítico tudo, maior o efeito que o desgaste terá. Além disso, os trilhos estão ficando tão estreitos em drives de alta capacidade que uma falha ou defeito de apenas algumas moléculas no revestimento magnético pode resultar em blocos defeituosos.

Quando há uma escolha, e tudo o mais sendo igual, sempre optarei por unidades de menor capacidade. Ainda estou usando unidades há mais de uma década, mas tenho certeza de que nenhuma das unidades de maior capacidade de hoje ainda estar funcionando em 10 anos.

    
por 12.03.2010 / 11:38
0

ok, obrigado pelas respostas. Eu acho que deveria dar mais detalhes. Eu trabalho em um laboratório de pesquisa. Eu tenho um orçamento de cerca de US $ 13K para gastar neste servidor. Estamos fazendo experimentos de sequenciamento que gerarão ~ 50 GB de dados por corrida e alguns experimentos de microscopia gerando entre 25 e 50 GB de dados por corrida. Não sei bem quantas dessas experiências serão feitas e por quanto tempo. Inicialmente recebi uma cotação para um array de 16TB. Nesse foram 16 drives SAS de 1 TB (Seagate ES.2 SAS, 7200 RPM). Eu não li nada para sugerir que as unidades SAS de 7200 RPM são melhores do que as unidades RE3, portanto, uma vez que são cerca de US $ 60 por unidade mais barata, isso me dá muito mais dinheiro para atualizar as especificações de CPU e RAM. Mas se eu voltar para a solução de 16TB (que provavelmente é mais do que suficiente por algum tempo) e escolher 16TB com drives RE3 em RAID10 (32 drives) e usar drives de 2TB em RAID6 para o backup que ainda é quase $ 1K mais barato que os subsistemas 2 x 16TB SAS (7200RPM), que é o dinheiro que posso usar para obter CPUs mais rápidas. Também devo salientar que um laboratório vizinho tem um array de 12TB e 32TB totalmente feito de unidades Hitachi 7K1000 (1TB) e eles não tiveram nenhum problema com essa configuração. Como não somos organizações de classe "empresariais", não sei por que o SAS seria melhor.

Para responder à primeira pergunta do Chopper: a citação que estou vendo diz "Controlador LSI Dual Port 8880M2 com BBU instalado". Isso controlaria dois subsistemas idênticos (conforme a citação). Embora o que estou descrevendo seja duas matrizes separadas mas quase idênticas (isso seria um problema?) Outra opção é um nó mestre com um subsistema (sem CPU) para backup. Isso tem um controlador 3Ware 96904i4e com o BBU instalado.

Para a segunda pergunta do Chopper, eu não sei qual sistema operacional usaremos ainda. Você está dizendo que o servidor Windows 2008 não pode lidar com matrizes maiores que 16 TB? Ou apenas "sem suporte" como em nenhum suporte oficial da Microsoft? Eu acho que o fornecedor usa o CentOS para o Linux, que eu não suporto. Temos o CentOS no nosso computador de microscópio e tem sido uma dor. Preciso primeiro me certificar de qual plataforma todos os nossos aplicativos são executados, até o momento, o Matlab, R e os alinhadores que eu uso são executados no Linux, então não há prob. Eu poderia sempre instalar o Ubuntu (ou Mint, meu favorito, em vez disso).

Existem tantas opções de configuração que é suficiente para fazer minha cabeça girar! Obrigado por toda sua ajuda até agora. Espero poder contribuir de volta. Este é um site útil.

    
por 13.03.2010 / 01:26
0

concorda com a posipiet. muitos discos aumentarão muito a chance de falha. assim derrotar os benefícios do ataque.

também, considere raidz2

    
por 13.03.2010 / 13:41