Como combinar dois conjuntos de arquivos

2

Eu tenho vários backups muito desorganizados de diretórios pessoais (mesmo usuário) que eu queimei ao longo dos anos. De vez em quando, copiei todo o diretório pessoal para um novo diretório em um disco rígido enorme. O formato do diretório home mudou muito ao longo dos anos e alguns arquivos grandes e importantes foram simplesmente removidos para economizar espaço (eu sabia que havia um backup). Pior ainda, alguns arquivos foram movidos de algo como myfile para old/myfile .

Agora, quero combinar esses backups em um diretório abrangente que tenha uma e apenas uma cópia de tudo (apenas a cópia mais recente). Eu gostaria de ferramentas que usam coisas como nome de arquivo, data de modificação e SHA1Checksums para combinar esses arquivos. Quais são algumas boas ferramentas que podem fazer isso?

Por favor, nenhum conselho sobre como eu deveria ter usado o software de backup. No entanto, não me importaria de ouvir alguns recursos de software que ajudam a converter esse modelo confuso atual em um modelo de backup centralizado.

Obrigado

    
por User1 22.02.2010 / 01:59

2 respostas

4

O método mais simples que posso imaginar é copiar cada pasta, uma de cada vez (em ordem de data de arquivamento), para uma pasta principal. Em seguida, use software de desduplicação para verificar a pasta principal e remover itens duplicados.

    
por 22.02.2010 / 03:57
0

Eu tenho esse problema eu mesmo. Estou pensando em usar o software controle de versão (por exemplo, git ou Subversion (Veja também: TortoiseGit e TortoiseSVN )) para fazer isso por mim. Supondo que você geralmente tenha seus backups agrupados em timestamps progressivos, ou seja, você tem, por exemplo, / backup1 / a partir de 2010, / backup2 / a partir de 2012, / backup3 / a partir de 2015, etc ... (ao contrário das datas de backup sendo misturadas em cada árvore de diretórios) - então isso funcionará perfeitamente. Isso permitirá que você:

  1. Combine todos os seus arquivos de backup em um repositório, com o qual você pode acessar todos os arquivos de maneira organizada.
  2. Confirme cada árvore de diretórios de backup em ordem cronológica e mantenha-a assim.
  3. Compare facilmente as versões dos arquivos (especialmente arquivos de texto, usando um utilitário diff ) entre si.
  4. Continue usando este sistema para futuros commits, para que você nunca precise fazer isso novamente.

O único problema com isto é que o software de controle de versão normal não se adapta bem a cargas de pastas e especialmente a arquivos grandes e / ou binários (executáveis). No entanto, existem soluções de controle de versão criadas para isso. Eu encontrei 3 aparentemente bons (eu não testei nenhum ainda) que tudo funcionará no Windows e Linux:

É claro que, se você tiver movido subdiretórios inteiros dentro de seus backups ao longo do tempo, como eu, essas soluções de controle de versão quase certamente não serão compatíveis com isso. Para isso, há um software de eliminação de duplicação, que você pode executar na consolidação final da árvore de diretórios de backup, que deve ter todos os arquivos mesclados (uma vez que diretórios movidos serão simplesmente comprometidos, ignorando sua duplicidade). :)

Espero que ajude ...

    
por 25.10.2017 / 17:05

Tags