Qual é a taxa de transferência máxima teórica de um dispositivo NAS para 100 estações de trabalho com conexões de 1 Gb / s? [fechadas]

1

Essa é uma pergunta difícil de perguntar, pois depende de várias suposições. Mas vamos supor que temos 100 estações de trabalho que precisam se conectar a um dispositivo de armazenamento conectado à rede. Qual é a taxa de transferência máxima que um NAS pode fornecer para essas estações de trabalho, se cada uma delas tiver uma conexão de 1 Gb / s? Eu estou tentando dimensionar um NAS para uma instalação com 100 estações de trabalho e alguns equipamentos científicos (digamos, equivalente a mais 20 estações de trabalho). Os vendedores disseram: "você me diz o que precisa". Eu preciso conectar 100 estações de trabalho a algum sistema que servirá diretórios home a estações de trabalho, alguns servidores que rodarão máquinas virtuais para aplicativos como licenças e servidores web - mas vamos nos concentrar no que um dispositivo NAS poderia oferecer, dado 1 Gb / sec conexões. Se o NAS estiver fornecendo 20gb / s, suponho que no máximo 20 estações de trabalho a qualquer momento transfiram arquivos na taxa máxima.

Questões relacionadas são os requisitos típicos de E / S de arquivos de uma estação de trabalho, digamos, em um ambiente de computação científica?

    
por Christian Marks 16.06.2014 / 13:08

2 respostas

1

Você precisa de alguma coleta de dados. Isso pode levar basicamente 4 formas que eu posso pensar. Uma combinação deles pode ser melhor, mas individualmente estou listando-os do que considero ser o pior para o melhor.

  1. Pergunte ao fornecedor (ou a um grupo de fornecedores) e baseie-o no que eles dizem. Todos devem ter calculadoras para adivinhar esse tipo de carga. Eles podem até mesmo pessoas capazes de lhe emprestar uma SAN para experimentá-la (mas você provavelmente terá que gastar capital significativo com ela para que isso aconteça). Isso é semelhante a perguntar aqui no Server Fault, mas os fornecedores devem ter conjuntos de amostras mais significativos do que o que você recebe de alguns de nossos usuários.
  2. Parte de trás do envelope: descubra que tipo de tarefas as pessoas fazem em seu ambiente com arquivos em seu diretório inicial. Eles carregam grandes conjuntos de dados, planilhas, na verdade, carregam programas armazenados em seu diretório pessoal? Com base nisso, crie um perfil hipotético para um computador típico (a quantidade de dados que eles estão carregando, presumindo que seja em rajadas, e multiplique isso pelo número de computadores, e espalhe ao longo do dia de trabalho usando algo como uma distribuição de poisson) .
  3. Reúna alguns dados de amostra de algumas estações de trabalho de pessoas ao longo do dia. Isso depende do sistema operacional, mas você pode usar ferramentas como sar em ambientes Linux e Perfmon em ambientes Windows. Então, pegue este perfil e extrapole usando um método semelhante ao acima.
  4. Reúna os dados de todas as estações de trabalho. Isso, claro, seria o melhor.
por 16.06.2014 / 14:08
3

O desempenho de armazenamento nem sempre é sobre o rendimento ...

Então, para a realidade ...

Hoje, eu provavelmente criaria uma solução NAS para o conjunto de clientes que você tem com conexões de 10 GbE com ligação dupla a um par de switches empilhados em cruz (ou um switch de chassi). Não é como se você tivesse muitas opções ...

NAS --- 2 x 10GbE ---> switch --- 1GbE ---> computing workstations

Isso se baseia nos seguintes fatores:

  • O que geralmente está disponível no cenário NAS (você normalmente não verá nada maior que 1 x 10GbE em soluções comerciais)
  • O que é acessível para a maioria das organizações (as portas de 10 GbE são comuns entre as atuais ofertas de comutadores)
  • Haverá uma certa quantidade de excesso de inscrição. (precisa dimensionar para as condições de pior caso)
  • Você não está executando 10GbE nas estações de trabalho.

No nível do NAS, você deve se preocupar com:

  • Tamanho do conjunto de trabalho de dados típico.
  • IOPS de armazenamento necessário no back-end.
  • Capacidade e espaço para crescimento / expansão.
  • Tiering / caching.
  • Resiliência (RAID, etc)
  • Backups.
por 16.06.2014 / 14:29