Quais formatos de arquivos compactados são eficientes com rsync?

1

Todo administrador de sistema sabe que rsync é o caminho a percorrer se você precisar fazer backups de arquivos grandes, e. g. um arquivo de banco de dados: como ele usa compactação delta, ele substitui apenas blocos que foram modificados do arquivo original para o de backup, evitando muita sobrecarga.

No entanto, para determinados formatos de arquivo, como gzip e bzip2 , modificar o arquivo faz com que a totalidade dos blocos seja copiada novamente, pois causa algum tipo de butterfly effect na estrutura do arquivo que o modifica, mesmo quando se altera apenas alguns bytes.

Então, quais formatos de arquivos compactados são os mais rsync amigáveis? Por outro lado, existem outros formatos que devem ser evitados quando o tempo é dourado e há 10K de dados que devem ser armazenados em backup?

    
por ibelcomputing 20.01.2015 / 17:55

1 resposta

4

Você sabia que as versões recentes de gzip têm uma opção --rsyncable ? A partir do manpage:

While compressing, synchronize the output occasionally based on the input. This increases size by less than 1 percent most cases, but means that the rsync(1) program can take advantage of similarities in the uncompressed input when syncronizing two files compressed with this flag. gunzip cannot tell the difference between a compressed file created with this option, and one created without it.

    
por 20.01.2015 / 18:00