Esta resposta foi editada depois que a pergunta foi esclarecida.
What are other reasons effects clouds to prefer DAS
Onde "DAS" significa armazenamento anexado direto, ou seja, discos rígidos SATA ou SAS.
Os fornecedores de nuvem usam DAS porque oferecem melhorias de preço / desempenho de ordem de magnitude. É um caso de dimensionamento horizontal .
Em suma, discos rígidos SATA e controladores SATA são produtos baratos. São produtos de mercado de massa e têm preço muito baixo. Ao construir um grande grupo de PCs baratos com drives SATA baratos, o Google, Amazon e outros obtêm uma grande capacidade a um preço muito baixo. Em seguida, eles adicionam sua própria camada de software no topo. Seu software faz replicação de vários servidores para desempenho e confiabilidade, monitorando, reequilibrando a replicação após falha de hardware e outras coisas.
Você pode dar uma olhada no MogileFS como um representante mais simples do tipo de software que o Google, a Amazon e outros usam para armazenamento. É uma implementação diferente, claro, mas compartilha muitos dos mesmos objetivos e soluções de design dos sistemas de larga escala. Se você quiser, aqui está um ponto de partida para saber mais sobre o GoogleFS .
stated later in the paper, Clouds should use SAN or NAS because of DAS is not appropriate when a VM moves to another server
Existem 2 motivos pelos quais os SANs não são usados.
1) Preço. SAN são extremamente caros em grande escala. Embora possam ser a solução tecnicamente "melhor", eles normalmente não são usados em instalações de grande escala devido ao custo.
2) O Teorema da CAP O teorema CAP de Eric Brewer mostra que, em grande escala, você não consegue manter uma consistência strong, mantendo a confiabilidade aceitável, tolerância a falhas e desempenho. As SANs são uma tentativa de obter consistência strong no hardware. Isso pode funcionar muito bem para uma instalação de 5.000 servidores, mas nunca foi provado que funcione para os 250.000 servidores do Google.
Resultado: Até agora, os fornecedores de computação em nuvem escolheram empurrar a complexidade da manutenção do estado do servidor para o desenvolvedor de aplicativos. As ofertas atuais de nuvem não fornecem um estado consistente para cada máquina virtual. Servidores de aplicativos (máquinas virtuais) podem falhar e seus dados locais podem ser perdidos a qualquer momento.
Cada fornecedor tem sua própria implementação de armazenamento persistente, que você deve usar para dados importantes. As ofertas da Amazon são bons exemplos; MySQL , SimpleDB , e Simple Storage Service . Essas ofertas refletem o teorema CAP - a instância do MySQL tem consistência strong, mas escalabilidade limitada. SimpleDB e S3 escalam fantasticamente, mas são apenas consistentes.