Pessoalmente, gostaria de ver se há uma maneira de trabalhar nos servidores para usar algo como o glusterfs ou o DRBD, um sistema de arquivos em cluster, para que ele sincronize automaticamente o sistema de arquivos. Isso exigiria algum tipo de sistema de heartbeat e fencing para que você não acabe com cenários divididos e opções de recuperação quando um servidor ficar inativo, mas você terá esses problemas com clusters de dados.
O rsync acabará com possíveis problemas em manter os dados sincronizados nos momentos certos; como você vai empurrar os dados e puxar dados? Com que frequência? Sua solução é arquitetada de uma maneira que você não estará sobrescrevendo os dados quando eles forem alterados em A e B ... como você decide qual é o "autoritativo"?
A outra opção é o armazenamento compartilhado; uma SAN de algum tipo que armazenará os dados e seus front-ends da web serão lidos a partir dela. A SAN manteria todos os dados no RAID e manteria backups decentes para fins de redundância.