Como o JavaScript pode ser executado antes de percorrer o HTML resultante?

0

Eu encontrei um site cujas páginas da Web consistem apenas em JavaScript. Este site hospeda vídeos que eu gostaria de espelhar. Quando abro este site no Firefox e leio a origem da página, vejo as importações de JavaScript nas tags de script. Quando eu inspecionar a página no Firefox, vejo HTML, incluindo uma tag de vídeo. Presumo que o JavaScript tenha gerado esse HTML. (Eu não tenho programado JavaScript, então eu não sei seus meandros.)

Como faço para expandir o JavaScript depois de baixar a página original? Eu sou após uma ferramenta de linha de comando que faz isso. O HTML resultante deve ser analisado por regex para extrair o nome do arquivo de origem de vídeo. Minha ideia atual de um script bash que captura o vídeo é estruturada assim:

wget the.website.com/page/of/javascript/;
cat inThePage.html |
executeJavaScriptAndBuildHTML |
sed "the HTML and extract the video file name" |
while read aVideoFileName; do
    wget $aVideoFileName;
done

Eu me pergunto se tal ferramenta existe; geralmente o JavaScript é executado no contexto de um navegador da web da GUI inteiro.

Tenho um pressentimento de que todo o objetivo da página apenas com JavaScript é impedir esse tipo de download automatizado.

    
por bimmo 09.08.2016 / 02:50

0 respostas