wget está retornando uma página html em vez de um arquivo original

4

No meu caso, o problema é com o SourceForge.net. Na verdade, eu estava tentando baixar esses arquivos:

http://sourceforge.net/projects/wxpython/files/wxPython/2.9.4.0/wxPython-src-2.9.4.0.tar.bz2/download
http://sourceforge.net/projects/wxpython/files/wxPython/2.9.4.0/wxPython-docs-2.9.4.0.tar.bz2/download

Algo não foi bom, então eu registrei wget , e o arquivo de log foi:

--2012-08-21 09:52:17--  http://sourceforge.net/projects/wxpython/files/wxPython/2.9.4.0/wxPython-src-2.9.4.0.tar.bz2/download
Resolving sourceforge.net... 216.34.181.60
Connecting to sourceforge.net|216.34.181.60|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 18846 (18K) [text/html]
Saving to: 'download'

     0K .......... ........                                   100% 6.30K=2.9s

2012-08-21 09:52:25 (6.30 KB/s) - 'download' saved [18846/18846]

--2012-08-21 09:52:25--  http://sourceforge.net/projects/wxpython/files/wxPython/2.9.4.0/wxPython-docs-2.9.4.0.tar.bz2/download
Connecting to sourceforge.net|216.34.181.60|:80... connected.
HTTP request sent, awaiting response... 200 OK

    The file is already fully retrieved; nothing to do.

FINISHED --2012-08-21 09:52:28--
Downloaded: 1 files, 18K in 2.9s (6.30 KB/s)

Como você pode ver neste arquivo de log, acabo recebendo um único arquivo HTML: (

Isso mostra que o wget não espera na página para permitir que a página da Web o redirecione para outro local, e baixa a própria página.

Pergunta:

Eu quero esses dois arquivos, com o wget, como posso?

    
por Santosh Kumar 21.08.2012 / 06:30

3 respostas

4

Parece que o redirecionamento está desativado em seu wget, tente especificar --max-redirect=2 ou um número maior. Você provavelmente também deseja especificar --trust-server-names para permitir que o wget atualize o nome do arquivo após o redirecionamento, caso contrário, os arquivos baixados ainda serão chamados de download .

    
por 21.08.2012 / 07:12
1

Seu caso é redirecionado, mas quando você redireciona apenas para seus cookies, FireFox tem dois extension que exporta txt file do seu cookie com wget format e o segundo importa. Então você usa:

wget --load-cookies your_cookies_file.txt your_URL
    
por 21.08.2012 / 17:58
-1

link

link

    
por 21.08.2012 / 10:27