Como criar um tar.gz determinístico usando o git-archive?

4

Criando um repositório git para testes.

~ $ mkdir somefolder
~ $ cd somefolder/
~/somefolder $ git init
Initialized empty Git repository in /home/user/somefolder/.git/
  ~/somefolder $ echo test > xyz
  ~/somefolder $ mkdir somefolder2
  ~/somefolder $ echo test2 > ./somefolder2/zzz
  ~/somefolder $ git add *
  ~/somefolder $ git commit -a -m .
[master (root-commit) 591fda9] .
 2 files changed, 2 insertions(+)
 create mode 100644 somefolder2/zzz
 create mode 100644 xyz

Ao transformar todo o repositório em um tar.gz, resulta em um arquivo determinístico. Exemplo

  ~/somefolder $ git archive \
>    --format=tar \
>    --prefix="test/" \
>    HEAD \
>    | gzip -n > "test.orig.tar.gz"
  ~/somefolder $ sha512sum "test.orig.tar.gz"
e34244aa7c02ba17a1d19c819d3a60c895b90c1898a0e1c6dfa9bd33c892757e08ec3b7205d734ffef82a93fb2726496fa16e7f6881c56986424ac4b10fc0045  test.orig.tar.gz

Novamente.

  ~/somefolder $ git archive \
>    --format=tar \
>    --prefix="test/" \
>    HEAD \
>    | gzip -n > "test.orig.tar.gz"
  ~/somefolder $ sha512sum "test.orig.tar.gz"
e34244aa7c02ba17a1d19c819d3a60c895b90c1898a0e1c6dfa9bd33c892757e08ec3b7205d734ffef82a93fb2726496fa16e7f6881c56986424ac4b10fc0045  test.orig.tar.gz

Funciona.

Mas ao alterar um pequeno detalhe, ao compactar apenas uma subpasta, ele não termina com um arquivo determinístico. Exemplo

  ~/somefolder $ git archive \
>    --format=tar \
>    --prefix="test/" \
>    HEAD:somefolder2 \
>    | gzip -n > "test2.orig.tar.gz"
  ~/somefolder $ sha512sum "test2.orig.tar.gz"
b523e9e48dc860ae1a4d25872705aa9ba449b78b32a7b5aa9bf0ad3d7e1be282c697285499394b6db4fe1d4f48ba6922d6b809ea07b279cb685fb8580b6b5800  test2.orig.tar.gz

Novamente.

  ~/somefolder $ git archive \
>    --format=tar \
>    --prefix="test/" \
>    HEAD:somefolder2 \
>    | gzip -n > "test2.orig.tar.gz"
  ~/somefolder $ sha512sum "test2.orig.tar.gz"
06ebd4efca0576f5df50b0177d54971a0ffb6d10760e60b0a2b7585e9297eef56b161f50d19190cd3f590126a910c0201616bf082fe1d69a3788055c9ae8a1e4  test2.orig.tar.gz

Nenhum tar.gz determinista desta vez por algum motivo.

Como criar um tar.gz determinístico usando o git-archive quando apenas deseja compactar uma única pasta?

    
por adrelanos 25.10.2014 / 01:34

1 resposta

3

Quando você faz uma exportação simples com HEAD, um registro de data e hora interno é inicializado com base no registro de data e hora da confirmação. Quando você usa opções de filtragem mais avançadas, o registro de data e hora é definido para a hora atual. Para mudar o comportamento, você precisa aplicar fork / patch git e mudar o segundo cenário, por exemplo, prova de conceito:

diff --git a/archive.c b/archive.c
index 94a9981..0ab2264 100644
--- a/archive.c
+++ b/archive.c
@@ -368,7 +368,7 @@ static void parse_treeish_arg(const char **argv,
                archive_time = commit->date;
        } else {
                commit_sha1 = NULL;
-               archive_time = time(NULL);
+               archive_time = 0;
        }

        tree = parse_tree_indirect(sha1);
    
por 25.10.2014 / 08:15