O Git-annex poderia de fato ajudá-lo em grandes blobs binários de dados. No entanto, acho que você deve considerar não colocar isso no mesmo repositório que o do seu código-fonte. Seria necessário baixar muitos dados para clonar seu repositório e será difícil recuperar espaço se esses arquivos grandes forem atualizados em algum momento.
Portanto, sugiro dar uma olhada nos submódulos Git e fazer/data
a submódulo para outro repositório contendo principalmente ou apenas dados do Git-anexo.
Acho que essa abordagem ajudará a manter o repositório de código-fonte limpo e rápido, além de fornecer uma maneira de usar o controle de versão até certo ponto nos grandes blobs binários.
edit / update: Eu acho que na verdade não faz muita diferença se você cria um submódulo para isso ou não. No final, é apenas um anexo do Git e os usuários podem baixar os arquivos sob demanda; Não há nada padrão para baixar todos os arquivos no clone.