O que torna o armazenamento em nuvem (Amazon AWS, Microsoft Azure, google Apps) diferente da rede de armazenamento do data center tradicional (SAN e NAS)?

8

Alguma confusão devido à minha pergunta, para simplificar:

"Que tipo de armazenamento os grandes provedores de nuvem usam e por quê?"

Até onde eu entendo, no entanto, não consigo encontrar qualquer tipo de diferença de rede oficial do Storage entre datacenters e nuvens típicos, todos os provedores de nuvem estão usando DAS diferente dos datacenters típicos.

Mesmo o DAS tem muitas desvantagens do que o SAN ou o NAS, eu quero aprender os detalhes por que as nuvens usam o DAS para fins de armazenamento ou de aplicativos.

Qualquer recurso ou descrição será apreciado para que eu fique claro.

EDIT: Durante a leitura do artigo "Desafios de Rede e Abordagens Resultantes para a Construção em Nuvem em Grande Escala, David Bernstein e Erik Ludvigson (Cisco)" eles mencionam isso,

Curiously we do not see Clouds from the major providers using NAS or SAN. The typical Cloud architecture uses DAS, which is not typical of Datacenter storages approaches.

Mas aqui há um conflito: na minha opinião e também declarado mais adiante, as nuvens devem usar SAN ou NAS porque o DAS não é apropriado quando uma VM move-se para outro servidor e ainda precisa acessar o armazenamento do servidor original.

Quais são os outros motivos pelos quais as nuvens preferem DAS, NAS ou SAN? Que tipo de armazenamento os grandes provedores de nuvem usam e por quê?

    
por Berkay 01.03.2010 / 05:53

4 respostas

4

Esta resposta foi editada depois que a pergunta foi esclarecida.

What are other reasons effects clouds to prefer DAS

Onde "DAS" significa armazenamento anexado direto, ou seja, discos rígidos SATA ou SAS.

Os fornecedores de nuvem usam DAS porque oferecem melhorias de preço / desempenho de ordem de magnitude. É um caso de dimensionamento horizontal .

Em suma, discos rígidos SATA e controladores SATA são produtos baratos. São produtos de mercado de massa e têm preço muito baixo. Ao construir um grande grupo de PCs baratos com drives SATA baratos, o Google, Amazon e outros obtêm uma grande capacidade a um preço muito baixo. Em seguida, eles adicionam sua própria camada de software no topo. Seu software faz replicação de vários servidores para desempenho e confiabilidade, monitorando, reequilibrando a replicação após falha de hardware e outras coisas.

Você pode dar uma olhada no MogileFS como um representante mais simples do tipo de software que o Google, a Amazon e outros usam para armazenamento. É uma implementação diferente, claro, mas compartilha muitos dos mesmos objetivos e soluções de design dos sistemas de larga escala. Se você quiser, aqui está um ponto de partida para saber mais sobre o GoogleFS .

stated later in the paper, Clouds should use SAN or NAS because of DAS is not appropriate when a VM moves to another server

Existem 2 motivos pelos quais os SANs não são usados.

1) Preço. SAN são extremamente caros em grande escala. Embora possam ser a solução tecnicamente "melhor", eles normalmente não são usados em instalações de grande escala devido ao custo.

2) O Teorema da CAP O teorema CAP de Eric Brewer mostra que, em grande escala, você não consegue manter uma consistência strong, mantendo a confiabilidade aceitável, tolerância a falhas e desempenho. As SANs são uma tentativa de obter consistência strong no hardware. Isso pode funcionar muito bem para uma instalação de 5.000 servidores, mas nunca foi provado que funcione para os 250.000 servidores do Google.

Resultado: Até agora, os fornecedores de computação em nuvem escolheram empurrar a complexidade da manutenção do estado do servidor para o desenvolvedor de aplicativos. As ofertas atuais de nuvem não fornecem um estado consistente para cada máquina virtual. Servidores de aplicativos (máquinas virtuais) podem falhar e seus dados locais podem ser perdidos a qualquer momento.

Cada fornecedor tem sua própria implementação de armazenamento persistente, que você deve usar para dados importantes. As ofertas da Amazon são bons exemplos; MySQL , SimpleDB , e Simple Storage Service . Essas ofertas refletem o teorema CAP - a instância do MySQL tem consistência strong, mas escalabilidade limitada. SimpleDB e S3 escalam fantasticamente, mas são apenas consistentes.

    
por 01.03.2010 / 10:13
1

Se você usar DAS, a disponibilidade é o seu problema

Se eles usam DAS, então a disponibilidade é problema deles. E se forem bons, estarão usando várias camadas de abstração para garantir que o problema não se torne seu problema. Em vez de ficarem presos em como escolhem montar seus discos dentro de seu datacenter, a questão é se a disponibilidade que eles garantem em seu SLA é adequada às suas necessidades. Ah, e o verdadeiro elefante na sala, o que você faz se eles saírem do negócio (provavelmente para alguns provedores, mas você ainda deve considerar isso) e o que você faz se você usar esses dados localmente e sua conexão interweb for indisponível - o último é substancialmente mais provável do que a escolha do DAS, levando diretamente a uma interrupção.

    
por 01.03.2010 / 08:20
0

Embora eu não tenha a resposta no DAS vs SAN / NAS ... Há muitas coisas a considerar ao procurar soluções de armazenamento.

A quantidade de dados? Se estamos levando cerca de Gb, tudo bem, um NAS com um backup pode fazer o trabalho. Se houver terrabytes de dados, o preço sobe muito rápido.

Acho que o preço é o principal fator ... se você tem uma SAN, precisa:

  • Administradores para configurá-lo / gerenciá-lo.
  • Sala de servidores (eletricidade, largura de banda, medidas de segurança em torno dessa sala, ...)

E ainda assim, você não tem redundância alguma. Se você tiver acesso a um datacenter, as coisas podem ser diferentes.

Outra coisa a considerar é a acessibilidade. Você está arquivando? Se a acessibilidade não for um problema, alguns pares de vezes por dia / semana / mês você arquiva em sua solução de armazenamento.

Se, por outro lado, você tiver dados que precisam ser acessados constantemente, você encontrará rapidamente um gargalo de largura de banda, limitação de hardware (como E / S). Mas, por outro lado, se você tem grande quantidade de transferência com seus dados, há boas chances de que uma solução de armazenamento on-line lhe custe muito.

O ROI (Retorno sobre investimento) é o que todo fornecedor de soluções de armazenamento on-line anuncia e geralmente tem razão, dependendo do uso, é claro.

Boa sorte.

    
por 01.03.2010 / 06:39
0

(apenas opiniões e vastamente generalizante).

A diferença é a camada de abstração que você está olhando (geralmente).

A SAN / NAS normalmente fornece um volume no qual você pode instalar um sistema de arquivos. O valor dessa abordagem para o sistema final é que você terceirizou os detalhes do hardware físico (por exemplo, nível de RAID, localização física, etc.).

Por outro lado, o armazenamento em nuvem geralmente fornece uma interface para um sistema de arquivos. A vantagem aqui é que muitas vezes você pode obter recursos de ordem superior de graça (por exemplo, o Dropbox faz a versão automática de todos os arquivos, de forma transparente).

    
por 01.03.2010 / 08:07