A maioria dos arquivos “efetivos” para converter para

3

Se você é como eu, você tem muitos arquivos espalhados em diferentes formatos (zip, tar, rar, tgz, tar.bz2 etc). Ao limpar minhas coisas, decidi basicamente deixar meus arquivos em paz (e geralmente acessar o conteúdo via archivemount ou avfs). Como um breve aparte, na maioria das vezes eu não estarei escrevendo para esses arquivos, mas na ocasião eu ou uma aplicação pode ser escrever arquivos de configuração / arquivos de índice / arquivos de descrição / arquivos perdidos ... para esses arquivos.

No entanto, eu gostaria de ter um formato preferido para converter esses arquivos para quando eu limpo um arquivo. Alguns fatores para este formato de arquivo são claros: deve ser fácil converter outros formatos para este formato, de preferência diretamente; acessar arquivos no repositório não deve ter sobrecarga significativa, o tamanho é de alguma consideração, mas não é importante, contanto que um arquivo não seja duas vezes maior do que os mesmos arquivos quando extraído.

Agora não sou tão ingênuo quanto esperar que as pessoas respondam com "o melhor formato de arquivo é ...", em vez disso, espero obter algumas idéias sobre os prós e contras dos vários formatos de arquivo que você pode usar nessa situação. .

    
por HandyGandy 07.08.2011 / 06:13

3 respostas

5

No mundo Unix tar é o formato de arquivo de fato. É claro que existem outros formatos que podem ser lidos e escritos, mas tar é o formato go-to sempre que você quiser agrupar arquivos.

Sua pergunta real parece ser qual sistema de compressão usar. A compressão é sempre uma troca entre velocidade e taxa de compressão. Onde você pega o acerto de velocidade também pode variar, alguns sendo eficientes para descompactar, mas demorando muito para comprimir, alguns ao contrário.

Você deve usar o que funciona melhor para você. Nenhuma compactação significa fácil acesso e atualização do seu arquivo. Isso também significa que os sistemas de controle de versão e de backup, como rsync , podem examinar mais profundamente seus dados e fazer backups incrementais mais eficientes. Por outro lado, muita compressão mantém o tamanho baixo. Formatos como gzip e bzip2 são os formatos de compactação sem perdas mais usados, mas outros, como lzma e 7z , existem. Muitas dessas ferramentas também incluem opções para diferentes taxas de compactação usando o mesmo algoritmo.

    
por 07.08.2011 / 09:31
4

Depende.

  • Se você não precisa armazenar as permissões, vá com 7z. Ele fornece acesso rápido a arquivos individuais (já tentou extrair um arquivo de um tar de 100 GB?) E boa compactação. Uma vez eu hackeei um script de script de script de restauração de permissões com find e sed. Tentarei descobrir isso se você estiver interessado.

  • Para arquivos pequenos (no máximo alguns GB) eu usaria o tar compactado. Se a velocidade é importante, eu não a utilizaria para arquivos maiores. xz é melhor que o bzip2 que é melhor que o gzip. Alguns live / rescue cds não possuem xz, mas eu ainda tenho que ver um sistema sem o bzip2.

  • Para arquivos maiores, o tar descompactado é uma boa escolha. A velocidade é aceitável na maioria das vezes. Dependendo do que está nos arquivos, pode não fazer sentido compactá-lo. Os arquivos de áudio e vídeo já estão compactados e não podem ser mais compactados com algoritmos sem perdas.

  • O Star pode fazer tudo que o tar pode e tem suporte a arquivos esparsos. Infelizmente não é tão amplamente usado.

por 08.08.2011 / 22:09
2

Eu gostaria de usar zip , porque ele pode acessar eficientemente qualquer arquivo do arquivo morto, embora tenha uma taxa de compactação aceitável; com .tar.*z , o arquivo deve ser primeiro descomprimido, depois lido (não dizendo que tar é ruim por si só, mas funciona melhor se você compactar / descompactar tudo de uma vez).

    
por 07.08.2011 / 13:02

Tags