Calculadora de velocidade para conjuntos de Raid

3

Primeiramente minhas desculpas se esta pergunta foi feita. Eu pesquisei… e pesquisei mais um pouco e não consigo encontrar o que estou procurando.

Alguém sabe de um software ou calculadora baseada na web que permitirá que você conecte uma configuração de RAID (exemplo abaixo) e produza esperadas velocidades de R / W, esperançosamente em MBs

Número de disco, tamanho, rotação, tipo, tipo Raid

EX. (8, 73Gb, 15k, SAS, Raid 1/0)

Ou

EX. (6, 146Gb, 10k, FC, Raid 5)

Eu achei severamente que calcular o espaço disponível. Algumas que fornecem algumas informações de velocidade, mas não podem ser realistas porque não fazem uso de spin ou digitam a consideração.

    
por Alan 07.08.2009 / 16:13

9 respostas

5

Eu não sei de um calcualtor que pode lhe dizer isso, em parte porque existem muitos outros fatores além dos fatores de tipo de disco e conexão. Os controladores RAID fazem uma grande diferença, assim como o firmware nesses controladores, o tipo de dados, assim como a capacidade da placa-mãe de enviar dados. Sua melhor aposta é o benchmarking por conta própria. Eu não posso nem pensar em uma maneira de escrever uma calculadora fazer esse tipo de coisa. Também acredito que provavelmente para a maioria das operações a rede irá afunilar antes do RAID.

    
por 07.08.2009 / 16:19
8

Existem algumas variáveis que podem afetar a velocidade, mas eis algumas idéias básicas para ter uma ideia do que um determinado conjunto de raid deve ser capaz de fazer.

Taxa de transferência do disco rígido

Supondo que uma busca aleatória completa uma média de 1/2 de uma rotação (180 graus) longe do setor desejado, o tempo médio de acesso aleatório é uma média de busca mais o tempo que o disco leva para girar 180 graus. / p>

  • Em um disco de 10K RPM 1/2 de uma rotação leva aproximadamente 3ms.

  • Em uma velocidade de 15K disco 1/2 de uma rotação leva aproximadamente 2ms.

  • Tempo médio de pesquisa para um Seagate Cheetah 15K6 é cotado a 3.5ms para leituras e 3.9ms para gravações (eu presumo as gravações incluem um período para alinhar a cabeça nas faixas do servo). Um disco de 10k é um pouco mais longo.

So, a raw estimate is an average of 5.5ms per random seek for a 15K drive and 7ms for a 10K drive. Tagged command queuing will optimise this slightly. Thus, for a 15k drive we have a theoretical random throughput of about 180 IOPS and 140 IOPS for a 10K drive.

RAID-1

Em um RAID-1 sem distribuição, as leituras podem ser divididas entre os dois discos, mas as gravações devem ser enviadas para ambas as unidades. Operações aleatórias darão a você duas vezes a taxa de transferência de um único disco para leituras e aproximadamente a taxa de transferência de um único disco para gravações. E / S sequencial tende a atingir o pico na taxa de transferência máxima de um único disco. Cabos de interface podem ou não apresentar um gargalo.

Conjuntos RAID distribuídos

Os discos RAID-5, RAID-10 ou RAID-50 têm os dados divididos em blocos espalhados de forma circular entre os membros do conjunto RAID. Supondo que não haja otimização de leitura antecipada, um disco pode ler no máximo uma faixa por revolução do disco. Um disco de 10K gira cerca de 170 vezes por segundo e um disco de 15K gira em torno de 250 vezes por segundo.

For a 64K stripe this comes to approximately 10MB/sec per 10K disk or 15MB/sec per 15K disk. Larger stripe sizes give you better sequential throughput on the disks - for example a 256K stripe size on an array of 15K disks would give you 60MB/sec per disk. A heavily random access workload will reduce this by introducing more latency between seeks. Read-ahead on a controller might increase it.

Assim, uma matriz com 14 discos de 15K usando faixas de 64K teria uma taxa de transferência de fluxo teórica de cerca de 210MB / s, sem outras restrições. Se o controlador não for rápido o suficiente, a taxa prática pode ser menor (por exemplo, eu nunca consegui obter um dell PV660 (Mylex DAC-FFX) para obter mais de uma leitura por duas revoluções dos discos). Uma carga de trabalho de acesso altamente aleatória também seria um pouco mais lenta, porque os acessos ao disco custarão menos de um por revolução do disco. Algumas leituras também serão usadas em dados de paridade para que a taxa de transferência real dos dados do aplicativo seja um pouco mais lenta.

Escrever gargalos

A gravação mais rápida possível em um RAID-5 envolve duas leituras e duas gravações. O controlador tem que ler o bloco antigo e o bloco de paridade correspondente, XOR os dados antigos e novos com o bloco de paridade para recalcular a paridade e escrever o novo bloco e paridade. O armazenamento em cache pode reduzir a quantidade de atividade do disco se o bloco antigo e o bloco de paridade estiverem no cache. O mesmo se aplica a um RAID-50.

Um RAID-10 precisa de dois acessos ao disco por gravação - um para o principal e outro para o espelho. O desempenho de leitura é aproximadamente equivalente a um RAID-5.

Gargalos de controle

Em alguns casos (o fibre channel é propenso a isso), as conexões com o subsistema de disco físico são de largura de banda um pouco menor do que os discos são teoricamente capazes de fornecer. Além disso, controladores de disco podem executar mal. Em muitos casos, isso é uma limitação mais significativa do que os próprios discos. O hardware SAN high-end geralmente possui grandes máquinas multiprocessadoras como controladores - eles também podem ter hardware personalizado para cálculos de paridade rápida. O controlador de um EMC DMX ocupa metade de um rack sozinho - antes de colocar qualquer disco nele.

Ajustando o próprio disco

Os parâmetros de cache e leitura antecipada nos próprios discos também podem afetar a performance de certas cargas de trabalho. Por exemplo, discos usando o firmware 'V' da Seagate podem ser configurados para menos segmentos de cache maiores e leitura antecipada agressiva para otimizar a taxa de transferência de dados de mídia. O mesmo disco físico configurado para uso em um Clariion seria configurado com mais segmentos de cache menores para suportar um número maior de gravações menores de muitos clientes em uma SAN.

    
por 07.08.2009 / 17:13
2

O tipo de velocidade que você vai ver varia muito dependendo das unidades, do controlador e da sua carga de trabalho, de modo que você não vai precisar de uma boa calculadora que forneça bons resultados precisos e precisos.

    
por 07.08.2009 / 16:17
2

Você já pode perceber isso, mas ...

Além de todas as características da unidade, a velocidade será amplamente governada pelo desempenho de qualquer placa RAID. O que dependerá não apenas de coisas óbvias como sua interface (por exemplo, PCI-X). Mas mais dramaticamente a qualidade e o desempenho de suas rotinas de chipset.

    
por 07.08.2009 / 16:20
2

Como outros já disseram, não acho que isso possa ser feito nos termos que você declarou. Acho que o melhor que você pode fazer é calcular o desempenho relativo de diferentes opções de ataque, ou seja, tratar o hardware como uma constante. Ainda seria impreciso, mas pode dar alguma orientação.

Mas acho que você também precisa considerar por que existem diferentes configurações de ataque. Geralmente escolhe-se ao julgar as compensações entre desempenho, capacidade, proteção de dados e custo.

Se você não estiver familiarizado com as desvantagens, faça uma aparência em um gráfico de comparação para ver os méritos relativos.

Parece que a performance é o seu principal critério aqui, então você provavelmente sabe qual o nível de ataque que deseja; você só precisa encontrar o hardware com melhor desempenho.

    
por 07.08.2009 / 17:07
2

Aqui está um exemplo: fiz benchmarks com as mesmas unidades (7x750GB seagate barracuda ES2), mesma configuração RAID (tamanho da faixa, etc), mesma placa-mãe (Supermicro H8DMe), mesma CPU (Opteron 2214), mesma RAM ( 8GB ECC) e o mesmo sistema operacional (Linux), o mesmo sistema de arquivos (XFS, opção nobarrier) e diferentes controladores RAID . Aprecie os resultados:

  • Areca 1280: gravação de 250MB / s, 350MB / s leia, 21000 arquivo criado / s
  • Adaptec ASR52445: gravação de 240 MB / s, leitura de 350 MB / s, arquivo de 18000 criado / s
  • 3Ware 9550: gravação de 310MB / s, leitura de 410MB / s, arquivo 6500 criado / s
  • 3Ware 9650: gravação de 440 MB / s, leitura de 410 MB / s, arquivo 4500 criado / s

É claro que estes são os melhores resultados após definir todos os parâmetros de software para cada controlador (leitura antecipada, opções de caching, tamanho da requisição, tamanho da requisição ...) fazendo benchmarks longos e repetidos enquanto ajusta os vários knobs.

Uma das coisas engraçadas que descobri por benchmarking cuidadoso é que as configurações são totalmente diferentes se você usar as unidades Barracuda ES2 (32MB cache) e Barracuda ES (16MB cache), embora o desempenho máximo seja o mesmo.

Infelizmente, o armazenamento e o RAID são difíceis . É por isso que você não encontrará uma calculadora de desempenho fácil de usar.

    
por 07.08.2009 / 17:17
2

Eu encontrei uma calculadora que lhe dará multiplicadores de velocidade.

Tudo se resume a

  • JBOD:
  • Raid 0 (conjunto listrado)
    • Ler: [NumberOfVolumes] X
    • Escrever: [NumberOfVolumes] X
  • Incursão 1 (conjunto de espelhos)
    • Ler: [NumberOfVolumes] X
    • Escreva: 1 X
  • Raid 5
    • Ler: [NumberOfVolumes-1] X
    • Escrita: N / A Dependente do controlador
  • Raid 10: (Espelho de conjuntos listrados 4 unidades)
    • Ler: [4] X
    • Escrever: [2] X
por 09.06.2012 / 02:11
1

Se essas calculadoras existirem, elas estarão nos sites da Web do fornecedor. Tantas coisas podem afetar as velocidades de produção que uma simples calculadora seria inútil. Especialmente para qualquer RAID que inclua paridade, pois eles tendem a afunilar mais na CPU do Controlador RAID do que qualquer outra coisa. O melhor que você encontrará é, "regra geral, sua quilometragem pode variar", estimadores de tipo.

    
por 07.08.2009 / 16:20
1

Há muito mais envolvido na velocidade do que o layout de ataque subjacente, então duvido que você ache essa calculadora.

As coisas que fazem podem fazer a diferença:

Tipo de Raid

  • hardware
  • software
  • fakeraid (controlador RAID que descarrega os cálculos xor checksum para a cpu)

Em que tipo de barramento o controlador está ... com o qual ele está compartilhando esse barramento. A maioria das placas-mãe de classe desktop compartilha barramentos PCI com múltiplos slots.

O tipo de sistema de arquivos, o tamanho do bloco e seu alinhamento com o tamanho da parte inferior da raíz subjacente também entram em ação.

Tipo de unidade, velocidade de rotação, tamanho do cache

Finalmente, a carga de trabalho também irá interagir com todas essas coisas. Portanto, a questão mais importante é, na verdade, qual é o layout do disco e do RAID que correspondem bem às metas de carga de trabalho e disponibilidade de dados.

    
por 07.08.2009 / 16:26

Tags