Backup de múltiplos git repos do mesmo projeto (deduplicação)

1

Eu uso um servidor git central (uma instância do gitlab). Os desenvolvedores clonam projetos para um compartilhamento de samba em outro servidor. No momento, faço backups do servidor do gitlab e de todas as diretivas do desenvolvedor no outro servidor. Isso custa muito espaço em disco. Idealmente, gostaria de fazer backup apenas do servidor gitlab. Eu não posso fazer isso porque as mudanças que ainda não foram impostas podem ser perdidas (e não posso transferir a responsabilidade pelos backups para os desenvolvedores, por exemplo, forçando-os a empurrar tudo uma vez por dia). Existe uma solução para desduplicar esses dados com o git? Não tenho certeza se usar outro sistema de desduplicação antes do backup real funcionaria, já que até mesmo pequenas alterações em um repositório podem ser grandes para outro sistema quando o git packfiles é alterado.

    
por Chris Keschnat 16.02.2013 / 16:23

1 resposta

0

Depende de como você faz backup. Se você usar o git para fazer o backup, então é fácil: adicione um controle remoto para cada repositório dos desenvolvedores e git fetch todos eles. O Git, em seguida, faz a deduplicação para você, armazenando cada objeto apenas uma vez, não importa quantos remotos o tenham.

    
por 16.02.2013 / 16:43