Array em servidores que recebem várias centenas de GB de dados por dia

3

Espero que seja uma pergunta simples. No momento, estamos implantando servidores que servirão como data warehouses. Eu sei que com o RAID 5 a melhor prática é de 6 discos por RAID 5. No entanto, nosso plano é usar o RAID 10 (tanto para desempenho quanto para segurança). Temos um total de 14 discos (16 na verdade, mas dois estão sendo usados para o sistema operacional). Tendo em mente que o desempenho é um problema, o que é melhor - fazer vários RAIDs 1? Faça um grande RAID 10? Um grande RAID 10 foi nosso plano original, mas quero ver se alguém tem alguma opinião que eu não tenha pensado.

Por favor, note : Este sistema foi projetado para usar RAID 1 + 0, então perder metade da capacidade bruta de armazenamento não é um problema. Desculpe eu não tinha mencionado isso inicialmente. A preocupação é mais se queremos ou não usar um grande RAID 1 + 0 contendo todos os 14 discos, ou vários RAID 1 + 0s menores e, em seguida, distribuí-los usando o LVM. Eu sei que a melhor prática para níveis mais altos de RAID é nunca usar mais de 6 discos em uma matriz.

    
por Matthew 25.06.2012 / 16:02

5 respostas

5

Dê uma olhada em esta discussão detalhando o layout do disco para uma configuração RAID 1 + 0 em um servidor HP ProLiant:

6 Raid de disco 1 + 0

Um controlador Smart Array configurado no RAID 1 + 0 é uma faixa entre os pares espelhados. Dependendo de como você organizou suas gaiolas de unidade e qual controlador está usando, os discos provavelmente serão emparelhados entre os canais do controlador.

Por exemplo em uma configuração de 4 discos:

     Logical Drive: 1
     Size: 558.7 GB
     Fault Tolerance: RAID 1+0

     Logical Drive Label: AB3E858350123456789ABCDE6EEF
     Mirror Group 0:
        physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK)
        physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK)
     Mirror Group 1:
        physicaldrive 1I:1:3 (port 1I:box 1:bay 3, SAS, 300 GB, OK)
        physicaldrive 1I:1:4 (port 1I:box 1:bay 4, SAS, 300 GB, OK)

unidade física 1I: 1: 1 pares para unidade física 1I: 1: 3 e unidade física 1I: 1: 2 pares para unidade física 1I: 1: 4

Com esse número de discos, não há desvantagem em deixá-los em uma única unidade lógica. Você obterá os benefícios de mais eixos ( MOAR ) para cargas de trabalho sequenciais e maiores recursos de carga de trabalho aleatórios. Eu recomendaria ajustar o cache do controlador para influenciar as gravações (baixa latência) e, possivelmente, fazer algumas escolhas no nível do SO em relação a escolha do sistema de arquivos (XFS!) , elevadores de E / S (deadline ) e ajuste de dispositivo de bloco .

Em que distribuição do sistema operacional isso será executado?

    
por 25.06.2012 / 16:36
3

Matthew - Sou um cliente BIG da Splunk, usamos exclusivamente o R10 - seja em discos SAS para caixas low-end, Enterprise SSDs para sistemas médios ou FusionIO para nossas máquinas mais movimentadas. Você foi inteligente e dimensionado para o R10, confia em seus instintos, está no caminho certo.

Apenas criamos um grande PV / VG / LV para todos / splunkdata, deixando / opt / splunk nos discos de inicialização, por sinal.

    
por 25.06.2012 / 17:05
1

400 GB / dia é ~ 270 MB / min.

O RAID5 pode funcionar. O RAID 50 é provavelmente o melhor em termos de eficiência de armazenamento e desempenho de gravação. O RAID 10 proporcionará o melhor desempenho de gravação, mas com o custo de 50% de eficiência de armazenamento. Eu me preocupo com gravações pesadas mais as leituras aleatórias ... que vão cortar o desempenho geral.

O tipo de disco que você usa será crítico. Se você puder usar 10k ou 15k, o desempenho dos drives aumentará bastante, mas é claro que esses discos são mais caros e têm menor capacidade do que os drives SATA / SAS 7.2k empresariais, que chegam a 3 + TB no momento atual.

Por fim, ninguém pode dizer o que é melhor para o seu aplicativo, então você precisa testá-lo por conta própria. Minha recomendação é para uma placa RAID que tenha um cache de gravação grande (512 MB ou mais) e um cache de leitura de tamanho decente também. Então, teste várias combinações de RAID (eu sugeriria RAID5-6 e RAID5-10, assim como RAID50 e RAID10). Veja o que funciona melhor. Ajustar as configurações da placa RAID. Você encontrará a configuração ideal.

    
por 25.06.2012 / 16:21
1

"A preocupação é mais se queremos ou não usar um grande Raid 1 + 0 contendo todos os 14 discos, ou vários raid 1 + 0's menores e então distribuí-los usando o LVM."

Bem. Se você pensar sobre isso, você está basicamente nos perguntando se você deveria deixar o seu raid controller fazer a parte RAID0 do RAID10, ou se você deveria deixar o LVM fazer isso.

Eu acho que se você tiver o pior controlador de raid do mundo, então o LVM provavelmente superaria isso. Caso contrário, acho que você está seguro em permitir que o controlador de raid faça todo o trabalho.

    
por 25.06.2012 / 16:36
0

O RAID-10 reduzirá seu espaço disponível pela metade. Eu recomendaria o RAID-50, que requer pelo menos 6 unidades; Isso lhe dará grande tolerância a falhas e desempenho.

Você vai querer conferir e comparar vários cartões RAID, pois nem todos têm o mesmo desempenho. Caso você não saiba disso, certifique-se de usar unidades SATA corporativas, não de desktop, e não unidades "verdes".

    
por 25.06.2012 / 16:18

Tags