O Tar é uma solução de arquivamento adequada para vários backups de dados da mesma pasta?

1

Recentemente, decidi arquivar alguns dados usando o Alcatrão . Os dados consistem em numerosos backups da mesma pasta; o que significa que contém muitos duplicados. Eu li que, como o Tar não tem um índice, ele não funciona bem com dados que contêm muitas duplicatas. Então, basicamente, minha pergunta é se Tar seria adequado para arquivar esses dados?

Eu me preocupo principalmente com a preservação de todos os dados originais em um arquivo, isso inclui todos os registros de data e hora do arquivo: criação, modificação, acesso.

    
por JakeGould 22.05.2015 / 19:44

2 respostas

2

É claro que o Tar pode arquivar esses backups, não importa quantas duplicatas você tenha lá. Se você tiver 100 duplicatas do arquivo abc.doc em 100 pastas diferentes, elas serão arquivadas 100 vezes. Dito isto, não é eficiente.

Se uma ferramenta de backup puder desduplicar dados, ela reconhecerá esses 100 arquivos idênticos, um backup e fará referência a ele 99 vezes. Se uma dessas alterações de versão, ela removerá a referência e fará o backup separadamente.

    
por 22.05.2015 / 19:49
0

tar GNU

Hora de criação:

O Linux realmente não registra o tempo de criação de arquivos. Ele possui o timestamp ctime , que às vezes é confundido com o tempo de criação, mas na verdade é "tempo de alteração do inode": ele registra a última vez que houve uma alteração no arquivo ou em suas permissões, proprietário etc. muda mais frequentemente do que mtime . O ctime stamp é manipulado pelo kernel e não pode ser configurado para valores arbitrários pelo usuário (embora seja possível reconfigurá-lo para a hora atual com bastante facilidade).

Hora da modificação:

mtime é preservado por tar

Tempo de acesso:

tar normalmente altera o tempo de acesso, mesmo no arquivo original. Você pode evitar isso usando o sinalizador --atime-preserve . Você também pode querer a tag --preserve que preserva as permissões (e também a ordem de classificação do diretório).

Eu não sei se você pode fazer tar preservar atimes nos arquivos arquivados, mas você pode sempre corrigi-los:

  1. Untarring
  2. Usando touch -a -d TIME FILE em cada arquivo (com a hora no formato [[CC]YY]MMDDhhmm[.ss] )
  3. Repetição com tar --atime-preserve

aviso : Usar --atime-preserve atualmente lembra o atime para poder preservá-lo depois de lê-lo. Na maioria dos sistemas, isso fará com que o ctime seja alterado, o que às vezes pode interferir em outro software (por exemplo, software de segurança).

Outro software

Você pode pesquisar rsync (consulte este artigo por exemplo) ou um sistema de controle de versão (como git )

    
por 23.05.2015 / 02:34

Tags