Usando wget com Streamcloud e páginas onde você tem que esperar

0

Sou novo no bash scripting e como ouvi falar de "wget", decidi escrever um script para baixar apenas o arquivo .mp4 de um link streamcloud (ou qualquer outro).

Eu uso normalmente como:

wget -q -O - http://somelink.com | grep keyword

Mas o problema que estou tendo é que eu estou recebendo a fonte do site onde eu tenho que esperar alguns segundos até que eu "vá para o vídeo", e isso obviamente não é onde eu posso encontrar o arquivo mp4 ligação. Então, eu gostaria de saber como eu poderia obter a fonte da página que você acessa após a espera, onde você pode realmente assistir ao vídeo e cuja fonte contém o link mp4 (então eu seria capaz de o fazer). / p>

Na verdade, posso obter o link mp4 manualmente, mas gostaria apenas de automatizá-lo através de um script de shell.

Muito obrigado! Qualquer ajuda seria apreciada!

    
por Miquel Perez 20.06.2015 / 03:27

1 resposta

0

Você precisa salvar a saída do wget em um arquivo e examinar o html para ver como eles estão implementando o tempo limite e o redirecionamento. Existem várias técnicas que podem estar sendo usadas. Por exemplo, o mais simples é uma linha como essa na cabeça do html:

<meta http-equiv="refresh" content="2;url=http://newurl/"> 

Isso faz com que um navegador vá para o novo URL após 2 segundos. Você precisa usar uma ferramenta como sed para extrair o URL e, em seguida, executar o wget novamente no novo URL.

Soluções mais complicadas envolvem javascript.

    
por meuh 20.06.2015 / 11:45