Projeto de cluster do VMware vSphere para redundância de sites

8

Tenho uma pergunta sobre o melhor design para redudancy de site ao usar clusters do vSphere. Um pouco de informação de fundo sobre a nossa situação em primeiro lugar embora.

Somos uma empresa de médio porte com dois escritórios principais, localizados em diferentes países. Nossas redes estão ligadas por uma linha alugada de 150Mbps Layer2, atualmente subutilizada. Temos uma variedade de serviços em execução para uso interno dentro da empresa, alguns em servidores físicos e alguns em clusters existentes do vSphere. Em nosso departamento, também executamos vários serviços (quase todos executados sob várias formas de Linux) como NTP, Syslog, servidores de salto, servidores de monitoramento e assim por diante.

Temos agora o requisito de que esses servidores precisam ser redundantes dentro de cada local (que eles não estão no momento) e também redudantes do site (que são, até certo ponto, os servidores duplicados no 2º local com configurações mantidas em sincronia através de vários métodos na camada de aplicação). Não há SAN disponível para nós, pelo menos não algo que possamos usar no momento.

O custo também é um problema. Embora tenhamos algum orçamento disponível para isso, não podemos nos dar ao luxo de comprar SANs para ambos os locais, por exemplo.

Eu olhei para o recurso do VSA e parece que isso pode ser algo para nós, mas não tenho certeza de como resolver o requisito de site-redudancy.

No momento, para fins de teste, estou configurando em um laboratório um vSphere 5 com VSA em dois hosts ESXi. No momento, estou usando o kit Essentials Plus com a licença VSA, que me permite criar um cluster VSA em até três hosts, junto com uma licença do vCenter para gerenciá-los. Cada um dos hosts tem duas placas de rede de porta dupla e duas unidades de 600 GB, sendo executadas no Raid1. Em termos de hardware, isso será o suficiente para executarmos todos os serviços de que precisamos como VMs e forneceremos redundância dentro do site.

No momento, vejo apenas duas opções para ter redundância de site:

  1. crie um cluter do VSA idêntico no segundo local e mantenha os vários serviços sincronizados na camada de aplicativo (banco de dados sync, rsync e assim por diante).
  2. simplesmente mova um dos hosts do cluster existente para o segundo local, basicamente com o cluster do VSA abrangendo o link de 150 Mbps entre os sites.

Eu preferiria muito mais a segunda opção, mas não tenho certeza de como isso funcionará, se é que pode funcionar. Tecnicamente, devemos ampliar as VLANs necessárias na linha dedicada e disponibilizá-las no segundo local. A vantagem seria que não precisamos nos preocupar em sincronizar bancos de dados e afins. Mas tenho a sensação de que a largura de banda não será suficiente, não tenho como saber quanto tráfego o cluster do VSA gerará entre os hosts. Eu percebo que isso provavelmente dependerá do uso individual das VMs, mas ainda assim, não tenho idéia de como o VSA replica dados entre os hosts do ESXi.

Essas são minhas únicas opções ou minhas metas podem ser alcançadas de alguma outra maneira? Existe talvez uma maneira de ter algum tipo de cluster "cold stand by" no segundo local onde as VMs seriam sincronizadas uma vez por noite a partir do local principal? A ideia é que, caso o primeiro site fique indisponível, poderemos disponibilizar todas as VMs on-line. Estaríamos bem com os dados sendo 1 dia de idade.

Qualquer resposta é apreciada.

Atenciosamente, Stefan

    
por Stefan Radovanovici 01.11.2013 / 22:40

1 resposta

7

Eu simplesmente recomendaria manter dois clusters separados e lidar com a replicação no nível máquina virtual com o vSphere Replication . Isso está disponível para você com sua licença do vSphere Essentials Plus e permite que você mantenha um RPO entre 15 minutos e 24 horas (ajustável por VM), bem como a capacidade de replicar para tipos diferentes de armazenamento de dados. O vSphere Replication é um componente usado no gerenciador de recuperação de sites maior do VMware.

Eu uso a replicação para lidar com a proteção externa de algumas máquinas virtuais críticas. A revisão mais recente do software permite que você mantenha instantâneos pontuais no destino.

    
por 01.11.2013 / 23:52