Posso recriar um arquivo gzip exatamente, dado o arquivo descompactado original?

1

Eu tenho uma série de gzip de arquivos que desejo armazenar de forma mais eficiente usando xz , sem perder a rastreabilidade para um conjunto de somas de verificação dos arquivos gzip.

Acredito que isso seja capaz de recriar os arquivos gzip dos arquivos xz, embora esteja aberto a outras sugestões.

Para elaborar ... Se eu tiver um arquivo gzip denominado target.txt.gz e eu o descompactar para target.txt e descartar o arquivo compactado, quero recriar exatamente o arquivo compactado original target.txt.gz . Por exatamente, quero dizer, uma soma de verificação criptográfica do arquivo deve indicar que é exatamente o mesmo que o original.

Inicialmente, pensei que isso fosse impossível, porque um arquivo gzip contém metadados como nome do arquivo original e timestamp, que podem não ser preservados após a descompactação, e metadados como comentários, sistema operacional de origem e sinalizadores de compactação, que quase certamente não são preservados após a descompressão.

Mas então eu pensei em modificar minha pergunta: existe uma quantidade mínima de informações de cabeçalho que eu poderia extrair do arquivo gzip que, em combinação com os dados descompactados, permitiria recriar o arquivo gzip original.

E então eu pensei que a resposta ainda poderia ser não devido à existência de ferramentas como Zopfli e 7-zip , que pode criar fluxos compatíveis com gzip que são melhores (portanto diferentes) do programa gzip padrão. Tanto quanto sei, o formato do arquivo gzip não registra quais desses compressores o criaram.

Então, minha pergunta se torna: há outras opções que eu não tenha pensado que possam significar que eu possa alcançar meu objetivo como estabelecido no primeiro parágrafo depois de tudo?

    
por jl6 17.04.2017 / 18:55

1 resposta

0

Isso pode ser útil: link

O Grittibanzli é uma ferramenta para compactar um fluxo de deflação para um arquivo menor, que pode ser decodificado para o fluxo original de deflação novamente. Ou seja, ele comprime não apenas os dados dentro do fluxo de deflação, mas também as informações relacionadas ao deflação, como símbolos LZ77 e árvores Huffman, para reproduzir um arquivo gzip, png, ... exatamente.

    
por 03.07.2018 / 13:08