Embora não caiba em um orçamento de US $ 10.000, a opção final é ter duas SANs e ter os dados replicados em tempo real entre as duas SANs e, em seguida, usar o VMWare SRM para inicializar as VMs do outro lado. o evento de uma falha.
Para um orçamento de US $ 10.000, você deve conseguir um único array SAN e usar a função High Availability do VMWare, o que significa que no caso de uma falha de um host, todas as suas VMs são inicializadas imediatamente em outros hosts. Isso torna a SAN um ponto único de falha e você precisa garantir que ela seja rápida o suficiente para não se tornar um gargalo que afeta seu trabalho diário.
Para um orçamento de US $ 1.000, sugiro um NAS "barato" (como uma série QNap 4xx) e exponho o armazenamento compartilhado por meio do iSCSI. Eles só expõem interfaces de 1GbE, o que seria bom executar coisas como um controlador de domínio, mas não muito mais (eu tentei isso, nós temos um qnap 6Tb aqui e não é apenas para o trabalho de carga pesada iSCSI).
Pessoalmente, o que eu sugiro, se você puder pagar pelo tempo de inatividade, é ter um segundo servidor SQL instalado no Host B e enviar o log de transações para ele. Talvez você nem precise comprar hardware adicional para isso e verifique com seu representante da microsoft, mas talvez nem precise licencia-lo. Portanto, mantenha-os ativos e, em seguida, aponte seus aplicativos para o segundo servidor SQL quando o host ficar off-line.
Além disso, desaconselho strongmente clonar seu controlador de domínio, pois há problemas em retroceder após uma restauração (ou um instantâneo). Eu sugeriria novamente ter dois controladores de domínio, um em cada host, e permitir que sua própria replicação (DFS) lidasse com isso.
Para sua contabilidade e servidores RDS, sua solução de clonagem deve funcionar bem. Eu não sei o que você está executando no seu RDS, mas decidimos que podemos perder até 24 horas de dados sem repercussões sérias, então se você fosse apenas cloná-lo durante a noite você pode estar bem com isso.