zip
não é nativo do linux, mas se você tem a fonte, você provavelmente não deve se importar.
Por outro lado, 7zip
e xz
têm melhor desempenho, e compactar um arquivo tar de várias entradas com dados semelhantes é melhor para compactação do que zip
, que basicamente faz um arquivo por vez. Isso possibilita que zip
se recupere quando um arquivo é quebrado (devido a corrupção), onde um arquivo compactado tar geralmente tem mais problemas para recuperar e / ou mais irrecuperável.
Se você tiver a chance de alterar a geração do arquivo compactado bz2 (provavelmente você não perguntaria), faça o seguinte em vez de gerar o tar.bz2
:
- gera um
index.lst
usandofind <list_of_files_to_archive> > index.lst
- gera um tar.xz de index.lst + list_of_files_to_archive
Dessa forma, você pode extrair rapidamente o arquivo index.lst
sem descompactar todo o arquivo e determinar o conteúdo de index.lst se tiver o arquivo correto. Não tenho certeza se o padrão tar
pára depois de extrair index.lst
(pode haver outro no arquivo), então use o módulo tar do python para ter certeza de parar após a extração (e você imediatamente analisa o arquivo index.lst sem necessidade de armazenamento em disco, velocidade extra).