Notas gerais (fluxo de consciência):
- Pense muito sobre o que você está tentando proteger.
- Ninguém usa o VMware Fault-Tolerance. Ok, talvez alguém faça, mas há muitas restrições, e o caso de uso é particularmente restrito.
- Os servidores são mais confiáveis do que o esperado, especialmente ao trabalhar com sistemas de qualidade como o HP ProLiant. Supermicro seria outra história ...
- Avalie os modos de falha realistas. Um servidor HP ProLiant Gen9 não irá apenas falhar .
- Você pode encontrar falhas de componentes individuais, mas há redundâncias internas suficientes para lidar com a maioria dos problemas normalmente.
- Sério, fontes de alimentação redundantes, ventiladores redundantes, RAIDing de discos internos, os adaptadores NIC e FLR onboard raramente falham.
- Adicione o monitoramento do ILO, verificações abrangentes de integridade de hardware e a variedade de itens com impacto no tempo de atividade é reduzida a falhas de DIMM e problemas na placa de sistema.
Agora chegamos ao armazenamento compartilhado. O armazenamento compartilhado se torna um ponto de falha, dependendo de como ele é arquitetado.
- Algo como uma matriz anexada à MSA SAS é uma opção e pode trabalhe com VMware e dois hosts. Você pode comprá-los e adicionar a capacidade necessária.
- Uma configuração de nada compartilhado seria benéfica em alguns aspectos, mas adiciona certas complexidades.
- Existem opções hyperconverged como o VMware VSAN , a HPE StoreVirtual VSA ou de Starwind oferecendo.
- HPE VSA pode ser livre para até 1 TB de armazenamento para a sua configuração.
- Uma SAN de nível de entrada não é tão atraente, considerando que seus requisitos de espaço são incrivelmente baixos.
- É possível usar o armazenamento de uma única cabeça ... possivelmente até mesmo um servidor HP normal com um sistema operacional de armazenamento de sua escolha (Linux exportando NFS, Windows Storage Server, etc.)
- Eu documentei e delineou uma solução ZFS para Linux que pode fornecer failover de duas cabeças e armazenamento em cluster para armazenamento: Veja: link
- Outra solução que pode fazer nada compartilhado com um par de servidores é Zetavault .
- Junte isso com a replicação no nível da VM Veeam ou algo baseado em matriz, e você cobriu 99% dos possíveis problemas de armazenamento.
Mas, novamente, isso é uma função do seu risco. As pessoas podem facilmente descer pelo buraco de coelho da Alta Disponibilidade ...
Anfitriões de dois hipervisores ... tudo bem. Então você precisa de tecidos de comutação dupla? Interruptores empilhados? Agregação de link multi-chassis (MLAG / MC-LAG)? Um SAN com controladores duplos? Duas SANs? Replicação SAN? Replicação de VM? Replicação de VM para armazenamento diversificado?
Você tem diversidade de poder? Múltiplas PDUs? Várias unidades UPS? O site é suportado pelo gerador?
Então, com o que você ficou?
Eu acho que é melhor ter algumas opções. Talvez contrate ajuda adicional para cobertura. Documente a solução bem o suficiente para que o cliente tenha algumas opções. Faça um runbook / script de interrupção do sistema DR ou do sistema.