Um problema com simplesmente executar uma cópia completa dos arquivos é que existe a possibilidade de obter dados inconsistentes. Geralmente funciona assim
Veja um exemplo de inconsistência no arquivo. Se uma coleção de arquivos, file00001-fileNNNNN depende um do outro, uma inconsistência será introduzida se um dos arquivos for alterado no meio da cópia
- copiando file00001
- copiando file00002
- copiando file00003
- mudanças de arquivo00002
- copiando file00004
- etc ...
No exemplo acima, como o arquivo00002 muda enquanto o restante está sendo copiado, o conjunto de dados inteiro não é mais consistente. Isso causa desastre para coisas como bancos de dados mysql, onde as tabelas devem ser consistentes com seus índices, que são armazenados como arquivos separados ...
Normalmente, o que você quer é usar o rsync para executar uma sincronização completa ou dois do sistema de arquivos (menos coisas que você não quer, como / dev, / proc, / sys, / tmp). Então, temporariamente, coloque o sistema offline (para os usuários finais, isto é) e faça outro passo rsync para obter o sistema de arquivos. Como você já fez uma sincronização muito recente, isso deve ser muito, muito mais rápido e, como o sistema está off-line - portanto, sem gravações - não há chance de dados inconsistentes.