Como wget código real de uma página da Web para um elemento div

1
  1. Eu uso o wget para salvar uma página da Web em um arquivo 'annie.html'.
% wget -qO-  http://www.swagbucks.com/watch/video/523803/annie > annie.html
  1. Dentro deste arquivo está esta linha:
<div id="sbPlaylistVideoContainer" class="fullSize"></div>
  1. A pergunta é: Como obtenho o código real para este elemento <div> ? Se eu clicar com o botão direito no vídeo no Chrome para isso e clicar em "Inspecionar elemento", vejo o código real.

Parece com isso.

<video id="example_video_1_html5_api" class="vjs-tech" preload="none" src="blob:http%3A//www.swagbucks.com/096df37a-81fe-4c65-b082-0fe059254d6e" style=""><source src="http://progressive.totaleclips.com.edgesuite.net/137/e137013_257.mp4?eclipid=e137013&amp;bitrateid=457&amp;vendorid=1839&amp;type=.mp4"type="video/mp4"></video>

De onde o Chrome conseguiu isso? Não existe na página da web. Eu gostaria de obter a sintaxe de comando 'wget' apropriada que salvará este código em um arquivo.

    
por user577396 31.03.2016 / 15:04

2 respostas

2

Sem realmente analisar a página da Web, é impossível dizer com certeza, no entanto, é mais provável que o site esteja usando JavaScript para injetar o player de vídeo na página. O recurso "Inspecionar elemento" do Chrome mostra o estado atual do DOM, não necessariamente a verdadeira fonte da página.

Existem várias razões para um site fazer isso, incluindo detectar os recursos do seu navegador para renderizar um player apropriado (por exemplo, um vídeo em HTML ou um Flash player) ou ter a capacidade de alterar dinamicamente o vídeo.

    
por 31.03.2016 / 16:36
0

A página da Web é gerada dinamicamente. Como você visualiza a página da Web com o Chrome, que é compatível com HTML5, o servidor fornece a tag que é uma tag html5. O wget não se identifica como chrome e, portanto, o padrão do servidor é compatível com versões anteriores

Ambos os comandos são válidos embora.

    
por 31.03.2016 / 15:12

Tags