wget: baixe um site protegido por senha usando um formulário

1

Eu tenho um problema com o download de um site usando wget .

Primeiro, preciso fazer login no site com um nome de usuário e senha:

wget --save-cookies cookies.txt --post-data --cookies=on --keep-session-cookies 
     --post-data="strUser=username&strPW=password" 
     http://hostname/wwwawelle/member/nixlog.asp

Então, tento fazer o download do link completo do site :

wget -k -r -m -np --load-cookies cookies.txt 
     http://hostname/wwwawelle/member/80_01_member.asp

Recebo uma resposta dizendo que não estou logado, em seguida, ele me redireciona para:

http://hostname/wwwawelle/member/nixlog.asp?grund=notloggedin

Alguma idéia?

HttpFox

00:00:07.712    0.193   597 301 POST    302 Redirect to: 80_01_member.asp   http://hostname/wwwawelle/member/login.asp
00:00:07.943    0.255   481 11957   GET 200 text/html   http://hostname/wwwawelle/member/80_01_member.asp
00:00:08.232    0.060   428 (6054)  GET (Cache) text/css    http://hostname/wwwawelle/style.css
00:00:08.260    0.051   420 (589)   GET (Cache) application/x-javascript    http://hostname/wwwawelle/news/jscr_inc.js

Cookies

ASPSESSIONIDCSATRCQQ    APPIOGADBMLHOMFHCALPBFNL    /   hostname    End Of Session

Dados POST

strUser username
strPW   password
Abschicken  Anmelden

wget cookies.txt

# HTTP cookie file.
# Generated by Wget on 2011-03-28 14:23:17.
# Edit at your own risk.

hostname    FALSE   /   FALSE   0   ASPSESSIONIDCSATRCQQ    EBAJOGADDHGHCANLKJCMDCPP
    
por Rama 28.03.2011 / 11:18

3 respostas

2

Se o site estiver salvando a sessão com cookies, você poderá fazer logon usando um navegador e depois usar o cookie apropriado para continuar acessando o site. No entanto, se o site usar outros meios, como as variáveis PHP $ _SESSION, você estará sem sorte.

Se este é um site para o qual você tem acesso legítimo, certamente você pode configurar outros meios de acesso. Por outro lado, se você não tem acesso legítimo e está apenas tentando lixiviar o site de outra pessoa, que é a impressão que tenho da sua pergunta, espero que você falhe.

    
por 28.03.2011 / 13:08
1

Pode ser que o site esteja verificando referer , user-agent , etc.

Confira os plug-ins do Firefox HttpFox e Tamper Data . Eles permitem que você veja / manipule dados indo para / de qualquer servidor. Certifique-se de anotar quaisquer redirecionamentos e cookies vindos do servidor.

    
por 28.03.2011 / 12:43
-1

Tente isso antes do URL:

wget username:password@http://me.com/me.html

    
por 28.03.2011 / 11:24