Eu tenho uma série de gzip
de arquivos que desejo armazenar de forma mais eficiente usando xz
, sem perder a rastreabilidade para um conjunto de somas de verificação dos arquivos gzip.
Acredito que isso seja capaz de recriar os arquivos gzip dos arquivos xz, embora esteja aberto a outras sugestões.
Para elaborar ... Se eu tiver um arquivo gzip denominado target.txt.gz
e eu o descompactar para target.txt
e descartar o arquivo compactado, quero recriar exatamente o arquivo compactado original target.txt.gz
. Por exatamente, quero dizer, uma soma de verificação criptográfica do arquivo deve indicar que é exatamente o mesmo que o original.
Inicialmente, pensei que isso fosse impossível, porque um arquivo gzip contém metadados como nome do arquivo original e timestamp, que podem não ser preservados após a descompactação, e metadados como comentários, sistema operacional de origem e sinalizadores de compactação, que quase certamente não são preservados após a descompressão.
Mas então eu pensei em modificar minha pergunta: existe uma quantidade mínima de informações de cabeçalho que eu poderia extrair do arquivo gzip que, em combinação com os dados descompactados, permitiria recriar o arquivo gzip original.
E então eu pensei que a resposta ainda poderia ser não devido à existência de ferramentas como Zopfli e 7-zip , que pode criar fluxos compatíveis com gzip que são melhores (portanto diferentes) do programa gzip padrão. Tanto quanto sei, o formato do arquivo gzip não registra quais desses compressores o criaram.
Então, minha pergunta se torna: há outras opções que eu não tenha pensado que possam significar que eu possa alcançar meu objetivo como estabelecido no primeiro parágrafo depois de tudo?