Eu quero acessar a URL do fluxo de vídeo do telediario da televisão espanhola (RTVE) que você pode encontrar aqui em um flash player: link
Eu quero fazer isso com o script do linux, sem um navegador da Web.
Com o navegador Firefox e o addon do Firebug usando a guia de análise de rede, pesquisei mp4
(porque é um fluxo de vídeo MP4) durante o vídeo foi reproduzido. Eu encontrei um URL como
http://mvod.lvlt.rtve.es/resources/TE_NGVA/mp4/5/9/1377759930795.mp4?aksessionid=1377770543247_372201
que é o fluxo de vídeo do Telediario - 8 horas - 29/08/13 .
Eu li a pergunta Como encontrar o fluxo por trás um Flash player , mas existem apenas soluções de navegador (usando o wireshark para descobrir que o fluxo precisa do navegador para reproduzir o vídeo).
Além disso, a pergunta Como estão URLs de arquivos flash são protegidos / ocultos em sites de vídeo fumegantes? parece ser semelhante, mas não tem resposta definitiva.
Então, o que eu quero é: como ou onde posso encontrar esse mp4-URL no código-fonte do site?
Atualização 1: O ID de sessão do AK não é necessário. Isso significa que a URL do vídeo foi ontem
http://mvod.lvlt.rtve.es/resources/TE_NGVA/mp4/5/9/1377759930795.mp4
e hoje
http://mvod.lvlt.rtve.es/resources/TE_NGVA/mp4/7/4/1377846494447.mp4
Ao mesmo tempo, o único nome / número similar é o URL do instantâneo de visualização do vídeo (ontem)
http://img.irtve.es/imagenes/telediario-8-horas-29-08-13/1377760554521.JPG
e hoje
http://img.irtve.es/imagenes/telediario-8-horas-30-08-13/1377847608923.JPG
Atualização 2: agora extraí a caixa de mídia que reproduz o vídeo em flash. Parece que
<html><body>
<div>
<object type="application/x-shockwave-flash" height="100%" width="100%" data="http://www.rtve.es//swf/4.2.8/RTVEPlayerVideo.swf">
<param name="movie" value="/swf/4.2.8/RTVEPlayerVideo.swf"/>
<param name="allowScriptAccess" value="always">
<param name="allowFullScreen" value="true">
<param name="flashvars" value="assetID=2007594_es_videos&location=alacarta_videos">
<!-- solo video-->
<param name="wmode" value="opaque">
<param name="quality" value="high">
</object>
</div>
</body></html>
A única diferença a cada dia parece ser o assetID
.
Quando carrego esta página simples, um arquivo
http://www.rtve.es/api/videos/2008358/config/alacarta_videos.json
é carregado, com o número sendo o assetID
. Ainda não consigo encontrar uma conexão entre o URL do fluxo de vídeo e o arquivo assetID
ou json.
Atualização 3: Oh meu Deus! O número estranho para o URL são os segundos desde segundos desde 1970-01-01 00:00:00 UTC. Porque o comando GNU
date +%s
resulta em 1377856336, que é bastante semelhante aos números de URL. Mas os últimos três dígitos estão faltando.
Atualização 4: Eu decompilei o código-fonte do player (arquivo flash) http://www.rtve.es//swf/4.2.8/RTVEPlayerVideo.swf
. Não há nenhuma ocorrência do domínio de fluxo de vídeo http://mvod.lvlt.rtve.es
, o que significa que o jogador precisa obter essas informações de outra fonte. Talvez o arquivo json mencionado na atualização 2.