O seu URL fornecido é bem carregado, por exemplo:
wget "URL"
curl -O "URL"
Como mencionado nos comentários: quote. Sempre cite!
Letras como &
têm um significado especial em shells e a URL não será interpretada como você quer sem elas.
Quanto a fazer o download sem saber o nome do arquivo - ainda não sei ao certo o que você quer dizer, mas algumas observações:
Isto é específico do site para ebi.ac.uk
O URL fornecido é uma forma especial de URI . Provavelmente você está interessado na parte da consulta e, mais especificamente, na primeira seção: U00096.3
.
Você pode alterar isso para representar outros arquivos e intervalos. por exemplo, para fazer o download de U00000
para U00096
:
curl -O "http://www.ebi.ac.uk/ena/data/view/U00000-U00096&display=fasta&download=fasta&filename=U00000-U00096.fasta"
^^^^ data ^^^
A parte do nome do arquivo é simplesmente uma sugestão sobre o nome do arquivo. Você pode mudar isso para qualquer coisa que você quiser. Por exemplo: filename=myown.fasta
- não vai alterar o que é baixado apenas qual nome é proposto pelo servidor - > web-browser, e também pode ser usado por curl etc.
Existem muitas possibilidades de busca e listagem no site e você precisa pesquisar.
Mais sobre o que está acontecendo
Ao clicar no link de download, ou usar ferramentas como curl ou wget, uma solicitação é enviada ao servidor em ebi.ac.uk para um arquivo específico. No seu exemplo, é provável que um referenciador esteja definido para:
http://www.ebi.ac.uk/ena/data/view/U00096.3
e uma consulta GET informada como:
query['display'] = fasta
query['download'] = fasta
query['filename'] = entry.fasta
O servidor responde com algo, entre outros, como:
Content-Disposition: attachment; filename=entry.fasta
Esta é uma maneira de o servidor confiar uma sugestão para o nome do arquivo de volta ao cliente. Se você usar uma versão curl que tenha a opção -J
, poderá usá-la para salvar o arquivo com este nome: ou seja:
curl -OJ "URL"
Como mencionado
Isso é totalmente específico do site e a maneira como o URL é interpretado no servidor tem a ver com a maneira como o site é configurado.
Em um host diferente usando outra configuração com uma parte de consulta, como filename=foo.txt
poderia ser também que você receba o arquivo real chamado foo.txt
do servidor.
Quanto a este site, ebi.ac.uk, o arquivo não é um arquivo, mas um conteúdo gerado dinamicamente usando consultas a bancos de dados. O resultado da consulta é mesclado em um arquivo e exibido ao usuário final.