Existem pessoas com experiência em servir coisas semelhantes ao que você está pedindo.
Se você estiver trabalhando em um centro da NASA, precisará obter uma autorização para poder usar peer-to-peer; isso vale tanto para o servidor quanto para os usuários, portanto, apenas tornar os dados disponíveis via p2p pode torná-los efetivamente inacessíveis para alguns cientistas (a menos que estejam dispostos a passar por isso.
Pessoalmente, quando as pessoas pedem grandes quantidades de nossos dados (são imagens e cubos de dados, com a maioria dos arquivos abaixo de 100MB), se estiver sob alguns GB, tenho alguns CGIs que geram arquivos tarballs / zip em tempo real . Estávamos olhando para escrever nosso próprio gerenciador de downloads, mas estou pensando em ir mais genérico e escrever um BagIt interface para servir Sacos não preenchidos e um cliente para preencher os Sacos & verificando-os.
Para os dados do tamanho que você está falando, temos pessoas que nos enviam discos rígidos, formatamos e enviamos de volta. As probabilidades são de que eles precisarão de espaço em disco para armazená-lo quando baixá-lo, e isso só acontece algumas vezes por ano, então é mais eficaz para nós do que pagar por mais largura de banda. (Acabamos de receber uma remessa ontem de 7 drives de 2TB para alguém que deseja os dados completos para dois dos instrumentos cujos dados nós arquivamos aqui).
... e eu também tento me certificar de não gerar arquivos maiores que 2GB ... eles ficam muito difíceis de lidar e você começa a encontrar problemas com sistemas operacionais e sistemas de arquivos mais antigos.
...
E se alguém tiver alguma recomendação sobre limitação de largura de banda e conexão com um determinado IP dentro do Apache, eu ficaria grato - a cada poucos dias eu faço com que alguém da China abra todas as conexões disponíveis para extrair dados de nossos sistemas . Eu vi mais de 800 por vez. (os firewalls são gerenciados por outro departamento, e eles bloqueiam os IPs, mas não controlam)
...
Você também pode querer perguntar na lista de discussão Informática em Ciências da Terra e do Espaço - mesmo que não seja o seu campo, Estamos todos interessados em problemas de distribuição de dados.