8 MB / 10 K RAID5 vs 2 x 64 MB / 7,2 K RAID10

2

Estou pensando em substituir um servidor de arquivos antigo que compartilha um único volume RAID5 com 6 discos de 10K rpm com caches de 8MB. A substituição será de 2 volumes RAID10 de 4 discos cada. Os novos discos têm 64 MB de caches ... mas são apenas unidades SATA de 7200 RPM (WD RE4). Minha pergunta, então, é como você espera que os dois volumes sejam comparados?

Isso já é um negócio feito, mas faço a pergunta porque gostaria de ter uma ideia do que esperar antes de implantar isso. Meu instinto me diz que o novo sistema deve ser um bom upgrade de desempenho, especialmente por causa da divisão em dois volumes em vez de um. Também estou curioso para saber como seria se eu tivesse apenas um novo volume em vez de dois.

Eu me preocupo com a possibilidade de subestimar o impacto da velocidade de rotação da matriz antiga. Eu também me preocupo porque, enquanto eu espero que o novo sistema seja mais rápido, ele também é muito maior e, portanto, eventualmente verá um aumento na quantidade absoluta de dados transferidos por unidade de tempo ... então é é provável que seja suficiente mais rápido para lidar com esse aumento?

Desde que eu sei que importa, isso é para um servidor de arquivos tradicional que será usado para unidades mapeadas. Nenhum banco de dados, servidores da web ou qualquer coisa assim.

Se eu tiver a chance, executarei alguns benchmarks reais para comparar os arrays novos e antigos com o uso no mundo real e os publicarei após a implantação, mas, novamente, o teste verdadeiro não será até que o novo sistema esteja lidando tanta transferência de dados em relação ao tamanho do sistema atual.

    
por Joel Coel 15.02.2012 / 16:44

3 respostas

5

Por que 2 x 4-disco-R10's - por que não 1 x 8-disco-R10 com dois discos lógicos? Isso funcionará muito melhor e, em geral, será mais seguro.

Agora, para a sua pergunta 10k vs. 7.2k - enquanto os discos 7.2k serão inerentemente pelo menos 40% mais lentos em IOPS aleatórios (sim não muito mais lento para o trabalho sequencial) o que eu estaria mais preocupado é que a maioria dos discos de 7,2k tem 30% de 'ciclo de trabalho' - isto é, eles são projetados para ficarem ocupados apenas 30% do tempo e exceder esse nível realmente tem um impacto MASSIVO no MTBF. Eu posso atestar isso depois de ver literalmente centenas de 7.2k discos falharem em menos de um mês em alguns arrays que nós tivemos, mudar para 10k discos reduziu esse número para números únicos - então cuidado, 7.2 discos não deveriam ser controlados o tempo todo ok.

    
por 15.02.2012 / 17:14
2

"Desempenho" é algo que depende muito da carga de trabalho e é realmente difícil obter uma previsão confiável. As cargas de trabalho do servidor de arquivos podem ser quase qualquer coisa - da maior parte do tempo ocioso para mal-aleatório-leitura-escrita-martelada. Mas se os usuários estivessem bem com o antigo RAID5, eles provavelmente não ficariam insatisfeitos com o RAID10. Embora eu não apostasse em uma grande melhoria de desempenho - os discos SATA têm tempos de busca bastante altos e a carga aleatória sustentada (especialmente quando envolve gravações aleatórias junto com leituras aleatórias) pode diminuir a taxa de transferência para um rastreamento.

A separação de unidades lógicas só faz sentido se você quiser isolar diferentes tipos de cargas de trabalho (ou seja, você não deseja que a carga de trabalho A diminua a carga de trabalho B sob nenhuma circunstância). Se você não precisar desse tipo de isolamento, o desempenho se beneficiará do maior número de eixos em uma única unidade lógica.

BTW: os benchmarks são bons para orientação aproximada, mas para realmente permitir a conclusão de que o novo subsistema de disco tem desempenho melhor que o antigo, você precisaria calcular dados de desempenho médios (taxa de transferência, número de solicitações, tempos de solicitação, fila de disco comprimento) dos antigos e os novos arrays e compare.

    
por 15.02.2012 / 17:06
2

Os discos individuais provavelmente têm o mesmo rendimento sequencial ou maior do que os antigos, mas tempos de busca mais lentos devido à menor velocidade de rotação. Um raid5 de 6 discos tem cerca de 5 discos de taxa de transferência sequencial, mas não é tão bom em E / S aleatório, especialmente em gravações. Um raid1 + 0 de 4 discos (que é realmente o que a maioria dos fornecedores quer dizer quando dizem que o raid10) tem o rendimento sequencial de cerca de dois discos, mas lida com o IO aleatório melhor do que o raid5.

Dado que, eu diria que se você for usar os dois raid10s separadamente, eles terão um desempenho um pouco pior que o antigo raid5, a menos que sua carga seja principalmente escrita aleatória.

    
por 15.02.2012 / 17:10