A melhor opção para HA entre datacenters remotos?

3

Estamos analisando os requisitos do sistema que um novo cliente nos trouxe. Eles trabalham no campo da medicina e o sistema que eles querem que nós hospedemos deve estar no mínimo altamente disponível, e de preferência tolerante a falhas.

Estamos analisando o licenciamento do VMWare Enterprise para obter seus recursos de HA e FT com hardware compatível com FT. Não biggie - 10Gbs ethernet está caindo no preço e 1Gb ethernet é um não-problema.

No entanto, um dos requisitos dos clientes é que tenhamos um site de HA (não um FT, mas FT seria bom) em uma cidade totalmente diferente.

A largura de banda na Austrália é louca e cara, e nem sei se é possível obter um link de 1Gbps entre Sydney e Melbourne (aprox. 1000 km / 600 milhas). Eu provavelmente lutaria para conseguir um link de 100Mbps entre as duas cidades.

Quais são minhas opções para fornecer um sistema de HA? Não precisa estar com o VMWare, mas se um site ficar inativo, eu preciso fazer o login no segundo site, apertar o botão Iniciar e estar em funcionamento.

    
por Mark Henderson 28.09.2010 / 06:07

2 respostas

5

Atualmente, estou nas fases iniciais de planejamento / implementação para obter um datacenter remoto de DR / HA configurado para $ WORK. Nosso ambiente atual já é altamente virtualizado, tanto em termos de virtualização de servidores (VMware) quanto de virtualização de armazenamento (Compellent SAN). Assim, achamos que fazia mais sentido aproveitar essas tecnologias e as soluções de alta disponibilidade disponíveis.

Todos os nossos volumes VMFS atualmente residem na Compellent SAN e usaremos a replicação de volumes assíncronos de volume para manter as coisas relativamente sincronizadas (provavelmente a cada 15 minutos) em outra SAN no site remoto. Então, para as próprias VMs, estamos usando o SRM da VMware. Produto muito legal que eu estou supondo que você já ouviu falar. Se você quiser, pode praticamente abstrair / automatizar o failover para o datacenter secundário com um único clique no botão. Muito liso.

Felizmente, para nós, temos um link GigE entre os sites que usaremos para a replicação de SAN (entre outras coisas). Ao sincronizar a cada 15 minutos, os deltas de volume no nosso caso não serão tão grandes. Dependendo da quantidade de churn dos sistemas do seu cliente, pode não ser tão difícil manter as coisas sincronizadas em um link de 100 Mbps (ou até menor). Eu sei de outros clientes Compellent que estão sincronizando em um único T1. Obviamente, não há muita mudança de dados acontecendo lá ...

De qualquer forma, aqui estão algumas coisas a serem levadas em consideração:

  • Cuidado com suas lutas de swap. Eles provavelmente não precisam ser replicados. Claro, os sistemas no extremo vão precisar de luns de troca, mas você provavelmente pode obter essas VMs mapeadas novamente para luns locais. Dessa forma, você não precisará se preocupar com a sobrecarga de replicar dados inúteis.
  • Certifique-se de que seu fornecedor de SAN tenha algum plano para failback. Você não quer ficar "preso" ao seu ambiente de produção em execução no site de failover por meses porque não consegue descobrir como colocar as coisas em sincronia no site principal.
  • Isso é óbvio, mas teste, teste, teste. O VMware SRM torna isso muito fácil de executar e pode fornecer a você bons relatórios de teste de failover para entregar aos PHBs.
  • endereçamento IP. No nosso caso, temos 802.1QinQ em execução entre sites, portanto, endereçar novamente os servidores quando executados no site de failover (felizmente) não será necessário. Isso exige, no entanto, anúncios BGP (com pesos apropriados) de cada site, bem como regras de firewall a serem mantidas em cada site para que, quando o tráfego passar para o site de failover, as coisas funcionem como esperado.

Esse é todo o conselho que tenho por enquanto. Em seis meses, quando eu estiver (espero) prestes a finalizar o nosso sistema de DR, tenho certeza que aprenderei muitas outras coisas. :) Boa sorte e divirta-se!

    
por 28.09.2010 / 06:55
2

No $ WORK, estamos avaliando o VMWare SRM na HP P4000 SAN (AKA LeftHand).

    
por 28.09.2010 / 09:17