Modelos de camadas de armazenamento e SLA

1

Comecei a analisar os modelos de carregamento de armazenamento. Historicamente - tem sido puramente por gig, em uma grande piscina compartilhada.

Mas estou pensando em estender o modelo e analisar as ofertas de armazenamento em camadas, principalmente porque estamos analisando um investimento em SSD, mas sob nosso modelo de cobrança anterior, não conseguimos justificá-lo. (Nós temos alguns como um 'upgrade de cache do controlador').

Meu ponto inicial é:

  • Pegue um 'pedaço de armazenamento'. Provavelmente um grupo de RAID, mas talvez 'uma prateleira' ou 'um controlador'.
  • Resuma os shows usáveis.
  • Resumir as IOPs teóricas dos fusos (escritas de penalidade de leitura e escrita aleatórias)
  • Soma o throughput teórico de MB / s dos eixos.

Divida as IOPs e a taxa de transferência por TB disponível, para definir uma 'alocação de desempenho' com base em cada TB 'comprada'. E veja uma amostra de configuração SATA, amostra de configuração FC / SAS e SSD.

Agora, isso é uma simplificação que eu conheço - e é um cenário bem pior, em um mundo de grandes caches e vários outros gargalos.

Eu tenho uma grande pilha de estatísticas de desempenho de 'uso médio' e sei como minhas taxas de acerto do cache do mundo real se parecem - mas agora estou um pouco preso a como 'escalar' isso. Como exemplo, meus NetApp Filers estão me proporcionando taxas de perda de cache de 20 a 25%, e faz algo totalmente diferente com o cache de gravação e o WAFL, o que dificulta a comparação desse elemento. (Mas acho que assumir um cache de gravação alto não é irracional e, assim, permitir que eu desconsidere a penalidade de gravação e a latência de gravação estourada).

Portanto, esta é a minha pergunta - que abordagem você sugeriria para reunir, digamos, 3 níveis de 'oferta de armazenamento' (Arquivo, 'padrão' e alto desempenho)? Como você consideraria os retornos esperados dos benefícios de armazenamento em cache e consolidação?

Com relação ao armazenamento em camadas - isso é uma opção, porque é efetivamente o que já estamos fazendo com grandes caches de controlador. Mas ainda há uma necessidade de diferenciar o armazenamento "barato" e "rápido", e eu preciso e aprendo isso também.

    
por Sobrique 06.03.2015 / 20:19

1 resposta

1

A resposta mais simples aqui é cobrar por TB e basear seu preço no custo de fornecê-lo. Tenha uma classe de armazenamento que seja drives e SSD, outra classe para apenas drives e modificadores para outros serviços (como o backup, a replicação, etc.). Nesse ambiente, se você se deparar com um mural de desempenho baseado na composição do seu pool, precisará pagar pelo SSD adicional sem ter necessariamente que alguém o transmita.

Se você quiser entrar no ramo de ter algum tipo de SLA para desempenho, precisará de QOS. Algumas plataformas permitem limitar determinadas cargas de trabalho em termos de alguma métrica, o que seria algo que permite que você imponha ser um bom vizinho, bem como cobrar dos usuários pesados um baixo volume de armazenamento proporcionalmente ao que eles custam para você hospedar. / p>     

por 06.03.2015 / 21:28

Tags