Baixe todos os arquivos de mídia da página da Web

Question

Baixe todos os arquivos de mídia da página da Web

#1 resposta do solsTiCe (3 votos)
#2 resposta do Oli (3 votos)
#3 resposta do blade19899 (2 votos)
#4 resposta do Parto (0 votos)

3

Como baixar todos os arquivos de mídia (fotos + vídeos) de uma página da Web ?!

Qualquer aplicativo é aceitável, mas wget é preferível

por Maythux 10.07.2015 / 08:44

4 respostas

3

wget tem uma opção de espelhamento ( -m ) que pode passar por um site e fazer uma cópia local. É como a opção de pré-requisitos ( -p ), exceto que ele seguirá todos os links no domínio e baixará todas as páginas do site (que estão vinculadas). Se você precisa apenas de arquivos em uma página, -p é suficiente.

Se você planeja espelhar as páginas, use a opção -k para corrigir links. Isso é completamente opcional e não é necessário se você estiver apenas após os recursos.

Um problema que tive ao fazer isso é que alguns sites usam um arquivo robots.txt para impedir que o Google (e outros) copie ou armazene em cache seus ativos. wget normalmente adere a isso também, mas podemos desativá-lo. Vale a pena fazer isso como um todo.

Junte tudo e você acaba com algo assim:

wget -mke robots=off http://website

por Oli 10.07.2015 / 09:13

2

O auxiliar de download de vídeo é a sua opção mais fácil:

Video DownloadHelper :: Complementos para o Firefox

wget é um pouco mais complicado. Você pode wget uma página:

wget www.example.com/page.html

depois analise:

cat page.html | grep ".png"

e, em seguida, baixar essas imagens através do link, o comando anterior exibe:
wget www.example.com/images/image.png

por blade19899 10.07.2015 / 08:56

0

Esta extensão foi descontinuada no novo Firefox Quantum.

Firefox - DownThemAll Addon fará o trabalho muito bem.

Inicie o addon no menu "ferramentas" - > 'DownThemAll! Ferramentas '- >' DownThemAll '
Selecione "Fotos e mídia" na guia / menu superior.
Clique em Iniciar.

Veja a imagem abaixo:

por Parto 10.07.2015 / 14:37

Use crontab para reiniciar um serviço Upstart no horário? Desinstalando o ssh

score 3 · Accepted Answer

Tudo está na página de manual .

De qualquer forma, -p é a opção que você está procurando

wget -p www.example.com/index.html

No entanto, eu acho que não será capaz de fazer algumas coisas inteligentes (envolvendo javascript ). Depende da sua página.