O uptime real de 100% é estupendamente difícil de alcançar - em teoria, você precisa de planetas de failover redundantes. Se o que você realmente quer é "serviço pode sobreviver a falha de hardware", você pode agrupar todos os seus serviços ou procurar um provedor que faça VMs de alta disponibilidade (o que você alude a querer em sua pergunta).
Os benefícios de uma VM de alta disponibilidade são que você não precisa lidar com nenhuma das complexidades do clustering dentro de sua máquina Windows. Os serviços não precisam saber nada sobre failover ou replicação de dados, o que simplifica imensamente a configuração e o gerenciamento.
Provedores de "nuvem", como o Amazon EC2, podem realizar uma configuração de VM de alta disponibilidade, porque, se o nó em que uma instância estiver, você poderá detectar essa ocorrência e iniciar a instância novamente em outro nó. O EC2 não detecta automaticamente quando um nó falha e inicia o backup das ocorrências em outro local, mas há muitas ferramentas de monitoramento que podem lidar com esse requisito.
O local onde eu trabalho, Anchor Systems , também está lançando um produto gerenciado de alta disponibilidade VM. Não conheço nenhuma outra empresa de hospedagem "tradicional" que tenha algo assim, mas meu trabalho é fazer essas coisas funcionarem, não fazer a análise da concorrência. Não me surpreenderia se alguém tivesse algo acontecendo para isso.