Migração da infraestrutura do campus no local para o Amazon EC2. Factível?

1

Após uma queda de energia recente, estamos reavaliando a forma mais eficaz de fornecer, manter e dar suporte aos nossos recursos de TI.

Uma ideia que estamos considerando é mover nossa infraestrutura não crítica para a nuvem. Por exemplo, poderíamos manter apenas os seguintes serviços no campus:

  • DNS (talvez apenas um encaminhador)
  • DHCP (com failover)
  • Diretório e Kerberos (para autenticação de rede)

... e isso é tudo. Com um plano como esse, mesmo no caso de um desastre, simplesmente nos concentramos em manter nossa conexão com a Internet, e todos os nossos outros serviços ainda estariam disponíveis.

Eu estava pesquisando o Amazon EC2, mas ainda não estou comprometido com nada. Como outras faculdades ou empresas fizeram algo assim? Existe algum problema ou obstáculo que devemos conhecer? Existe algum blog / fórum que possa detalhar uma migração de nuvem no nível corporativo?

    
por Moduspwnens 18.10.2011 / 01:12

3 respostas

6

Potenciais capturas / barreiras:

  1. Largura de banda : Quando você fala sobre mover serviços intensivos de largura de banda como banco de dados e servidores de arquivos externos, você precisa dar uma olhada em como um tubo seria necessário para manter seu nível de desempenho. Dependendo do tipo de instituição que você representa, você pode ou não ter gigabit ou fibra de 10 gigabits no seu campus. Se você precisar de largura de banda garantida e puder pagar o investimento, uma conexão privada via AWS Direct Connect pode ser algo a considerar.

  2. Latência : Seus usuários podem ter aplicativos orientados a banco de dados que fazem coisas inteligentes como executar várias consultas instantaneamente para preencher listas suspensas (pior se estiverem executando contra .mdb arquivos em vez de servidores SQL). Ou, eles podem ter um compartilhamento de arquivos do Windows contendo 10.000 documentos do Word estrategicamente chamados, e pode levar minutos em vez de segundos para navegar. Esses problemas podem ser mitigados somente em parte , garantindo que você tenha uma conexão limpa, com baixa latência / baixo jitter ao seu ambiente hospedado. No entanto, a melhor solução é usar aplicativos projetados adequadamente para a nuvem (por exemplo, Google Apps em vez do MS Office ou um frontend de banco de dados baseado na Web, em vez de um banco de dados do Access).

  3. Custo : você precisará avaliar cuidadosamente se o custo de alugar servidores virtuais é comparável ao custo de manutenção de sua infraestrutura no local. Existem inúmeras variáveis, desde despesas de capital até eletricidade e custos de manutenção, e todas precisam ser consideradas em uma comparação entre maçãs e maçãs. Não se esqueça de que as contas de largura de banda de saída do EC2 e que os serviços que tradicionalmente vivem "on-premise" podem consumir uma grande quantidade dela.

  4. Confiabilidade : Sua conectividade com a Internet é mais confiável do que a sua infraestrutura de servidor existente? Se não, quanta redundância você precisaria adicionar e a que custo? Como uma interrupção do EC2, como as ocorridas em abril e agosto de 2011, afetou suas operações?

por 18.10.2011 / 02:34
2

Primary web server, old web server, Moodle server, Mahara server, VoIP servers, print server, file server, Wordpress server, student web server, two database servers and two SharePoint servers. If the latency increase in moving VoIP servers to the cloud isn't acceptable, it would also need to be on-site and be considered "critical" infrastructure. Otherwise, it'd ideally just be yet another thing that "just works" as long as we maintain that Internet connection.

Considere o seguinte como pontos de discussão adicional; não há respostas concretas aqui, apenas coisas fora da minha cabeça que você deve estar pensando e discutindo com seus colegas:

Provavelmente, você pode excluir o VoIP, juntamente com o servidor de impressão e o servidor de arquivos da nuvem. Eu suspeitaria que a latência do VoIP não seria aceitável sem muito trabalho. No entanto, o seu provedor de telecomunicações / SIP pode oferecer um serviço hospedado que pode valer a pena investigar. O arquivo e a impressão provavelmente estão vinculados a softwares legados (gerenciamento de imagens, por exemplo) que dependem da velocidade / latência da LAN para funcionar corretamente. Tenho certeza de que você vai encontrar um número de pontos de tropeço quanto mais você olhar para isso.

Os bancos de dados podem estar ok, mas novamente a latência pode não ser aceitável para os aplicativos que os utilizam.

Os servidores baseados na Web provavelmente funcionariam bem em um ambiente baseado em nuvem pronto para uso (Wordpress, Moodle, etc.), mas se dependessem de serviços principais que, neste momento, residam apenas dentro do servidor. Na rede do campus, você precisará verificar a replicação ou acessar esses serviços remotamente de forma segura (o que precisará ser feito na forma de uma nuvem privada e de um túnel VPN).

E uma grande confusão na nuvem é que as pessoas esperam que seu software e serviços se comportem de maneira diferente apenas porque estão "na nuvem" quando a pilha de serviços foi otimizada para aproveitar a arquitetura distribuída que a nuvem oferece. experimentará pontos únicos de falha quando uma instância cair.

É claro que sempre há licenciamento de software que pode ou não representar um obstáculo adicional.

E, obviamente, há a privacidade das informações e a salvaguarda das informações que podem ou não existir nesses serviços não críticos que podem deixar seu consultor jurídico em estado de confusão.

E você ainda precisa melhorar sua recuperação / continuidade de seus serviços principais: essa é a verdadeira questão raiz aqui, não é? E acrescente ao fato de que seus serviços principais agora incluirão conectividade de Internet redundante, priorizada e de alta qualidade, porque, sem isso, seus serviços em nuvem são efetivamente inúteis.

A quantidade de trabalho apenas determinando se algum desses serviços "não críticos" (e pode não ser crítico para você, mas para outro departamento, pode ser o mais importante deles; os acordos de nível de serviço podem ser coisa boa aqui, se você não tiver nenhum no lugar já) será um candidato de nuvem bem-sucedido não é trivial.

A coisa boa é que você estará fazendo um inventário / descoberta saudável de sua infra-estrutura de TI (o que é sempre benéfico) para determinar o que você pode ou não fazer (ou pelo menos pilotar). E como você só está gastando dinheiro em taxas de tempo de execução na nuvem, seu piloto não exige uma grande quantia de dinheiro.

    
por 18.10.2011 / 14:38
2

Eu gosto muito do EC2 para recuperação de desastres, mas estou sempre cético sobre mover grandes blocos de infraestrutura para ele. O que eu realmente amo no EC2 é DR - copiando tudo que é crítico. Se você realmente estabelecer as bases de planejamento, poderá ter seus sistemas operacionais no EC2 e localmente. Se o seu edifício de TI sobe em um glorioso incêndio, você pode ligar um monte de instâncias do EC2, re-apontar seu DNS e começar a servir. A beleza é que, quando estão off-line, eles não custam nada além de taxas de armazenamento estático.

Se você realmente fizer isso corretamente, poderá ativar os sistemas em qualquer local, conforme necessário. Isso também permite que você experimente de maneira livre e fácil os sistemas menos caros.

Onde você é um campus, você pode se tornar realmente grande com a tática do DR. Eu não sei a semântica dele para lidar com a Amazon, mas muitas faculdades estão carregando em torno de um espaço de endereço de classe B. Você pode expulsar uma rota do BGP para uma classe C reservada para serviços espelhados. Se o seu servidor da Web estiver nesse espaço de endereçamento, qualquer coisa no campus ou diretamente conectada será encaminhada para a máquina do campus, e qualquer coisa que encontrar a Amazon mais próxima será encaminhada para lá. ( desde março de 2010, isso não foi possível. Foi altamente solicitado e pode ou não ser possível agora ). Na verdade, você poderia estabelecer isso estritamente no campus sem as rotas BGP se focar apenas nas tabelas de roteamento internas.

Não há dúvida de que isso fornece complexidade adicional, mas definitivamente o tornará muito resiliente.

    
por 19.10.2011 / 18:34