Primeiramente, muitos dos provedores de nuvem IaaS oferecem poderosos recursos de instantâneos que resolvem isso com bastante facilidade.
No EC2, se você executar um sistema baseado em EBS, poderá apenas instantaneamente fazer um instantâneo. Se algo de terrível acontecer à instância de origem, você poderá reverter para o instantâneo anterior em uma nova instância. Se você deseja arquivar um instantâneo, pode inicializar outra instância com ele anexada e usar algo como tar + s3 sem afetar negativamente a caixa de produção.
Existem vários problemas com essa abordagem que podem não estar aparentes no momento.
- Você está se trancando em uma única tecnologia. Se você fizer isso trabalhando no Ubuntu 10.10, e quiser ir para o 11.04, terá que atualizar o sistema de origem e, em seguida, fazer um instantâneo novamente. Da mesma forma, se você usar os instantâneos do EBS do EC2, precisará de uma nova solução se for para a nuvem de rackspace.
- Você não tem histórico de alterações se usar o rsync. Se você modificar alguma coisa no sistema 1, então algo quebra, é provável que você também quebre seu sistema de backup quando fizer o rsync.
- O rsync pode ter um impacto extremamente alto no seu sistema de produção.
O que você realmente quer é um sistema de gerenciamento de configuração e alta disponibilidade de dados.
Eu recomendo que você escolha um sistema de gerenciamento de configuração, como fantoche (em main!), chef ou cfengine. Comece a fazer toda a sua configuração no sistema de gerenciamento de configuração e, em seguida, basta inicializar um sistema genérico e aplicar o gerenciamento de configuração a ele. Adicionar em 'etckeeper' e você tem histórico.
Para alta disponibilidade de dados, o rsync deve funcionar e ser muito mais direto, já que você pode copiar os dados desejados. Há também drbd para ter o que equivale a uma "rede RAID1". Não são substitutos para backups de dados, que devem incluir instantâneos históricos (seja por meio de instantâneos de dispositivo de bloco ou algo parecido com tar) em vez de sincronizar com um host de recuperação (e se alguém excluir todos os dados que são rsynced na caixa de recuperação, excluindo tudo lá também?)