Wget não está baixando imagens em download recursivo

1

Eu usei este comando para fazer o download de uma página da web de forma recursiva em 5 níveis para navegar off-line:

wget -r -p --convert-links http://www.pythondiario.com

Mas as imagens não são baixadas corretamente.

Como corrijo isso?

    
por Ekapunk 26.08.2017 / 17:49

1 resposta

2

Como Satō Katsura observou em um comentário, algumas imagens nesta página estão em um host diferente. Por padrão, o wget não segue os links entre hosts (isso se aplica à recuperação de imagens, bem como ao percurso recursivo).

Para fazer o wget seguir os links entre hosts, passe a opção -H . Recomenda-se que também passe a opção -D para limitar quais hosts são percorridos, caso contrário você corre o risco de baixar muitos conteúdos vinculados.

wget -r -p --convert-links -H -Dblogspot.com http://www.pythondiario.com

Observe que -H e -D se aplicam a percursivos recursivos e a imagens. Você pode restringir ainda mais os links entre hosts adicionando as opções -R ou --reject-regex .

Consulte "abrangendo hosts" no manual para obter mais detalhes.

    
por 27.08.2017 / 02:00

Tags