cURL: download do arquivo HTTP

0

Eu tentei baixar um arquivo usando curl "https://www.dropbox.com/s/tf7e7vndqd9hv05/Ace_The_IELTS.pdf?dl=0" -o "file.pdf" , mas ele baixou um arquivo com poucos bytes. Quando eu abro o link no navegador, vejo a página da web aberta com o pdf, mas não baixada na minha área de trabalho. Eu acho que o comando curl está baixando a página da Web, mas não o arquivo PDF exato. Alguém pode me ajudar a baixar o arquivo usando curl. Estou faltando alguma coisa? Obrigado

    
por foo_l 12.01.2015 / 05:54

1 resposta

0

Os links dos arquivos do Dropbox vão para uma página da Web, que redireciona para o conteúdo real.

O link para o PDF acima está na verdade em

https://dl.dropboxusercontent.com/content_link/v0qPqJrCIS7IvTmXr0pXBFKnnbmZpsRfSNxDhfqcjLg88F7ErNCyNAaOIATPKrWT?dl=1

A maneira mais fácil de determinar o URL real é:

curl "https://www.dropbox.com/s/tf7e7vndqd9hv05/Ace_The_IELTS.pdf?dl=1" -o "temp.txt"

(observe o dl=1 )

Em seguida, observe o temp.txt :

<html>
  <head><title>Found</title></head>
  <body>
    <h1>Found</h1>
    <p>The resource was found at <a href="https://dl.dropboxusercontent.com/content_link/jGdZ7mfVMNV7VCiauE9T7kGpaOyBKyu6i8KaAzqLzUSaEd2ElXllzDeQEC8DCxHr?dl=1">https://dl.dropboxusercontent.com/content_link/jGdZ7mfVMNV7VCiauE9T7kGpaOyBKyu6i8KaAzqLzUSaEd2ElXllzDeQEC8DCxHr?dl=1</a>;
you should be redirected automatically.

<!--  --></p>
    <hr noshade>
    <div align="right">WSGI Server</div>
  </body>
</html>

Então você verá o URL correto.

    
por 12.01.2015 / 06:33

Tags