Baixe apenas uma página do Tumblr com o wget

0

Eu quero baixar as imagens de apenas uma página no tumblr.
Por exemplo, link

Ao carregar esta página no navegador (já testei o firefox e o chrome), existem exatamente 15 imagens, mas quando tento baixá-las com o wget, obtenho 60 imagens (correspondentes às páginas 7-11). O comando que eu uso para download é

wget -H -k -p -R "*avatar*" -A '.jpeg,.jpg,.bmp,.gif,.png' -np -nd -N -erobots=off -i http://landscapes.tumblr.com/page/7

Alguém poderia me explicar por que o wget faz o download de mais páginas do que a que foi fornecida como argumento e como fazer o download de apenas uma página? Obrigado antecipadamente.

    
por Jonh 17.08.2016 / 16:41

1 resposta

1

De o manual do wget :

-i file

--input-file=file

Read URLs from a local or external file.

[...]

-p

--page-requisites

This option causes Wget to download all the files that are necessary to properly display a given HTML page. This includes such things as inlined images, sounds, and referenced stylesheets.

Como seu comando inclui ambos, você está recuperando a página original, tudo vinculado a ela (incluindo todas as páginas posteriores) e todos os requisitos de cada uma dessas páginas.

Depois de remover o -i , ele busca apenas os requisitos da página original.

    
por 17.08.2016 / 22:52

Tags