Acho que encontrei a resposta final para minha pergunta:
BUP link
Recursos:
-
Ele usa um algoritmo de soma de verificação contínua (semelhante ao rsync) para dividir grandes arquivos em pedaços. O resultado mais útil disso é que você pode backup de imagens de disco, bancos de dados e XML de máquinas virtuais enormes (VM) arquivos de forma incremental, mesmo que eles geralmente sejam todos em um enorme arquivo, e não usar toneladas de espaço em disco para várias versões.
Ele usa o formato packfile do git (o controle de versão de código aberto sistema), para que você possa acessar os dados armazenados mesmo que não goste interface do usuário da bup.
Ao contrário do git, ele grava arquivos de pacote diretamente (em vez de ter um etapa separada de coleta / reembalagem de lixo), por isso é rápido mesmo quantidades imensamente gratuitas de dados. melhores formatos de índice do bup também permitem que você rastreie muito mais nomes de arquivos que git (milhões) e mantenha rastrear muito mais objetos (centenas ou milhares de gigabytes).
Os dados são "automagicamente" compartilhados entre backups incrementais sem ter que saber qual backup é baseado em qual outro - mesmo se o backups são feitos de dois computadores diferentes que nem sequer sabem sobre nós. Você acabou de dizer ao bup para voltar as coisas, e isso economiza apenas a quantidade mínima de dados necessária.
Você pode fazer o backup diretamente em um servidor bup remoto, sem precisar de toneladas de espaço em disco temporário no computador que está sendo copiado. E se o seu backup é interrompido no meio do caminho, a próxima corrida vai pegar de onde você parou. E é fácil configurar um servidor bup: apenas instale o bup em qualquer máquina onde você tenha acesso ssh.
O Bup pode usar a redundância "par2" para recuperar backups corrompidos, mesmo se seu disco não detectou setores defeituosos.
Mesmo quando um backup é incremental, você não precisa se preocupar restaurando o backup completo, depois cada um dos incrementais por sua vez; a backup incremental age como se fosse um backup completo, ele leva menos espaço em disco.
Você pode montar seu repositório bup como um sistema de arquivos FUSE e acessar o conteúdo desse jeito, e até mesmo exportá-lo sobre o Samba.
Edit: (19 de agosto de 2015) E ainda outra ótima solução é ainda melhor: link
Ele permite snapshots ao vivo, essencialmente dando recursos como o COW a qualquer sistema de arquivos antigo regular no Linux.
Editar: (15 de julho de 2016) E até outra ótima solução que sopra fora da água: link
É particularmente melhor que o bup na poda. Parece ter grande suporte para compactação, criptografia e deduplicação eficiente. dattobd + borg ftw !!!