RAID 0 InnoDB speed - Comparando 8 x 7.200 RPM ou 4 x 15.000 RPM

2

Estou planejando configurar uma matriz RAID para uso de espaço de rascunho em um servidor computacional (16 núcleos, 128 GB de RAM). Os usuários estarão rotineiramente criando grandes bancos de dados MySQL InnoDB (500GB) e armazenando-os temporariamente no espaço de rascunho. Os bancos de dados são preenchidos com dados de um cluster que pode ter até 1000 clientes MySQL conectados a um banco de dados de uma só vez. O controlador RAID é um controlador integrado PERC H710 com um cache não volátil de 512 MB.

Como o armazenamento é temporário, estou planejando usar o RAID 0 para o desempenho de leitura / gravação. A questão restante é se usar discos de 8 x 7.200 RPM ou 4 x 15.000 RPM. Um padrão de uso típico é que, depois que um banco de dados é criado, haverá poucas gravações nele. Haverá muitas leituras para análise, portanto, o tempo de busca de 15K ajudará aqui, no entanto, não sei como a melhoria de RPM se compara com a velocidade de distribuição de RAID 0 com discos extras.

Ignorando a capacidade da unidade como um fator, qual configuração seria preferível, 8 x 7200 RPM ou 4 x 15000 RPM? Peço desculpas se esse tipo de pergunta não tiver uma resposta clara.

Edit: Eu não olhei para o quanto o controlador RAID irá limitar o rendimento efetivo com base no número de discos no array ainda.

    
por billyshaneguy 21.03.2014 / 23:21

2 respostas

6

Há muito o que abordar aqui, abrangendo o design apenas para conhecer os preços e os atributos das tecnologias relacionadas.

Vamos supor que o motivo pelo qual você está escolhendo entre discos nearline de 8 x 7.200 RPM e 4 discos corporativos de x 15k é o custo. Vamos supor também que você esteja falando de 2,5 "discos de fator de forma pequeno ...

Eu raramente compro discos de 15k atualmente porque, se a latência e o desempenho aleatório de E / S for primordial, vou para soluções baseadas em SSD . Suas necessidades de capacidade não são enormes, portanto, use apenas 6 ou 8 discos corporativos de 10k RPM . Eles têm um melhor desempenho e perfil de capacidade do que os discos de 7.200 RPM e são um valor melhor do que os discos corporativos de 15k. No momento, os discos de 600 GB e 900 GB 10k SAS de 2,5 "estão em torno do mesmo preço de 1 TB de 7.200 unidades de 2,5".

Quanto espaço de armazenamento utilizável você realmente precisa? No mundo do disco de 2,5 ", as capacidades são:

  • 7.200 RPM - 500 GB, 1 TB
  • 10.000 RPM - 72 GB, 146 GB, 300 GB, 450 GB, 600 GB, 900 GB, 1,2 TB
  • 15.000 RPM - 72 GB, 146 GB, 300 GB

Mas há o lado acadêmico dessa questão. Se o perfil de leitura / gravação for sequencial, as unidades de 8 x 7.200 RPM ganham em taxa de transferência devido à contagem de fusos. Se é aleatório, é mais complicado. A borda ainda iria para os 8 discos mais lentos, mas não muito.

Se o seu conjunto de dados de trabalho couber dentro de 1 terabyte e for definitivamente espaço de rascunho, acabei de obter um 960GB SSD PCIe (ou dois) e pronto.

    
por 22.03.2014 / 20:31
1

Since the storage is temporary, I am planning to use RAID 0 for read/write performance

Você está errado.

O espelhamento não é apenas sobre disponibilidade. Também é sobre reduzir a latência. Se você está apenas fazendo acesso sequencial em uma única tabela, então o espelhamento vai desacelerar as gravações. Mas com vários usuários e / ou múltiplas tabelas / índices e / ou leituras aleatórias, o espelhamento melhora o desempenho.

Se o desempenho é o objetivo principal aqui, como diz o ewwhite, por que você não está olhando para os SSDs?

Há mais na história do que velocidade e capacidade de rotação. Por muito tempo, os fornecedores de unidades "empresariais" justificaram um diferencial de preço baseado na confiabilidade e no desempenho. Mas há um corpo crescente de evidências de que esse não é o caso. Por outro lado, eles tendem a se comportar melhor em modos de falha - uma unidade básica tentará muito comprometer o disco - o que pode atrapalhar seu MTTR. Por isso, usar discos corporativos em uma matriz pode fornecer uma melhor disponibilidade para a matriz como um todo.

Veja também:

O diferencial de preço deve ser considerado. As unidades Enterprise, IME, têm cerca de 4 vezes o custo das unidades básicas, mas normalmente oferecem apenas o dobro do desempenho.

Já que você não parece incomodado com a disponibilidade, então eu recomendo ir com os drives mais baratos - mas espelhá-los para o desempenho.

    
por 23.03.2014 / 00:50