Estimar tamanho de arquivo compactado em tar.gz

0

Eu tenho um conjunto de arquivos .tar.gz , que são arquivos de backup duplicidade (backups completos ou incrementais). Eu gostaria de calcular quais diretórios ocupam mais espaço em backups. Provavelmente será uma figura diferente para calcular quais diretórios ocupam mais espaço em um sistema de arquivos ativo, pois preciso explicar com que frequência os arquivos estão mudando (e, portanto, tomando espaço em backups incrementais) e quão compactáveis são os arquivos.

Eu sei que, enquanto muitos outros formatos de arquivo armazenam arquivos compactados como entidades diferentes dentro do arquivo, .tar.gz arquivos não, e, portanto, é impossível obter uma quantidade exata de armazenamento tirada no arquivo por um único arquivo após compressão. Existem ferramentas para calcular pelo menos algumas estimativas?

    
por liori 06.11.2012 / 19:52

2 respostas

0

Então, eu invadi um código C para encontrar alguns valores aproximados. O código mostra quantos bytes zlib leu do archive para chegar a cada arquivo subseqüente. O código está aqui: link

Parece que eu poderia extrair dados mais precisos, mas esses valores não devem diferir dos reais por mais do que alguns bytes por arquivo, e o erro é calculado sobre todos os arquivos, então deve ser bom o suficiente para o propósito descrito na pergunta.

    
por 10.11.2012 / 01:13
1

Se você estiver interessado em um tamanho de arquivo específico após a compactação, basta compactar o arquivo com gzip uma vez. Esse deve ser o método mais direto.

    
por 07.11.2012 / 04:26

Tags