Faça o download de URLs que mudam dinamicamente via script

4

Eu quero escrever um script para baixar todas as palestras de Walter Lewin desta página no formato wmv: link

No entanto, os links para o arquivo wmv, por exemplo, para a primeira palestra: link mudam quando alguém recarrega a página.

Então é possível escrever um script que baixe as palestras uma após a outra automaticamente no formato wmv. Como alguém pode fazer isso?

eu tentei wget -A wmv -r http://videolectures.net/mit801f99_physics_classical_mechanics/

e

httrack "http://videolectures.net/mit801f99_physics_classical_mechanics/" -O ~/VideoLecture "-*" "+*.wmv"

ambos não funcionaram.

Observação: essa pergunta surgiu da seguinte pergunta sobre física sx: link

    
por Julia 21.10.2012 / 14:05

2 respostas

4

for i in 'seq -w 1 35'; do wget -p -U Mozilla -A wmv -r  "http://videolectures.net/mit801f99_lewin_lec$i/"; done

parece funcionar. Mas acho que deve haver uma maneira mais elegante de fazer isso.

    
por 21.10.2012 / 21:10
2

Você tem que analisar a página de download. Desative o script em seu navegador e abra o código da fonte da página da Web.

Quando faço isso, vejo a seguinte parte "interessante":

<p>
<img alt="Download Video" src="http://media.videolectures.net/rel.1350055487/icons/download.png" />
Download&nbsp;<a href='http://videolectures.net/site/secure_dl/eea58431dcc3454ad91ef7c89a49958b/50845240/afuvgg7fochnsdyl2ee4hlcsvwamqha2/tag=23313/mit801f99_lewin_lec01_01.wmv' rel='nofollow'>mit801f99_lewin_lec01_01.wmv</a>&nbsp;<small>(Video 336.5 MB)</small>
</p>

Agora isso é

  1. Download da página principal
  2. Lembre-se de cookies
  3. Página de análise - procure por download, lec01 _ *. wmv
  4. Use o URL encontrado com os cookies lembrados para baixar o arquivo wmv
por 21.10.2012 / 22:00