Vamos considerar o "Stratus" como um proxy para tolerância a falhas e alta disponibilidade, fornecido em hardware e software. Suponha, no momento, que eles não sejam o único fornecedor desse tipo.
A virtualização da máquina inteira, em oposição a coisas como uma VM Java, separa o estado do software do estado do hardware, encerrando um sistema operacional e todos os aplicativos executados sobre ele em um contêiner puro. Depois de ter esse contêiner, fica mais fácil realizar coisas como HA e FT. Camada de hardware e hardware / camada de software As soluções HA e FT, como você tradicionalmente comprou da Stratus, realizam a mesma coisa, mas sem uma separação tão strong entre hardware e software. Tenha em mente, no entanto, que há um limite bastante obscuro entre essas coisas, que está se tornando mais obscuro o tempo todo, à medida que Stratus e outros avançam em direção às técnicas de virtualização para realizar essas coisas que costumavam ser feitas exclusivamente com hardware.
Praticamente todos os principais pacotes de virtualização podem oferecer alta disponibilidade. Isso é feito armazenando os arquivos da máquina virtual (configuração e imagens de disco) em algo que todos os membros de um cluster host podem acessar. Isso pode ser um servidor de arquivos ou uma SAN, ou algo em algum lugar no meio. Se algo der errado de forma catastrófica com a máquina física que hospeda sua VM, outro membro do cluster pegará essa VM e a executará. O sistema operacional convidado vê uma falha e reinicializa. Está offline por não muito mais tempo do que o sistema operacional inicializa. Se um problema não for catastrófico, você poderá mover a VM em execução (chamada Live Migration ou vMotion) para outro host e evitar o problema.
A tolerância a falhas real é um pouco mais escorregadia. Você tem que decidir o que isso significa para você. Se isso significa que você tolera um único cabo de rede sendo expulso por uma pessoa de manutenção, você pode obtê-lo através do agrupamento de NICs. Se isso significa que você tolera uma única falha na fonte de alimentação, você pode comprar uma máquina com fontes de alimentação redundantes. Se isso significar que uma falha catastrófica de um host não coloca a carga de trabalho offline, como muitas pessoas a interpretam, então apenas alguns hipervisores podem fornecer isso a você, e os que podem fazê-lo a um custo bastante alto termos de desempenho. Eles funcionam executando a VM em dois locais ao mesmo tempo em uma etapa de bloqueio ou tirando milhares de snapshots da VM por segundo e enviando-os para outro host, aguardando como um standby.
O hardware é geralmente mais rápido, mas muito mais caro.