Tornar o wget link-rewrite ciente de todos os arquivos baixados

2

Depois de baixar um tutorial via

wget -r -l 1 -k -nd -p http://scikit-learn.org/stable/tutorial/index.html

wget reescreve ( -k ) o link de todos os documentos na página index.html para apontar para links locais baixados via -r -l 1 . Este tutorial consiste em três páginas, com um link da página 1 para a página 2 (e da página 2 para a página 3), então a "estrutura" é

  • índice
    • página 1 (links para a página 2)
    • página 2 (links para a página 3)
    • página 3

O link na página 1 para a página 2 não é reescrito para o arquivo local da página 2, mesmo que wget tenha sido baixado na página 2.

Eu fiz algo errado? Existe uma maneira de corrigir isso?

    
por serv-inc 19.10.2015 / 17:08

1 resposta

2

O link fornecido é uma lista de tutoriais, e não um link para verificar o problema real que você tem.

Gostaria de sugerir com base no arquivo de base no seu exemplo é

/index.html

que está em seu próprio diretório e assumindo que os links também estarão nesse diretório, tente isto:

    wget -m -k -p http://scikit-learn.org/stable/tutorial
         or
    wget -m -k -p http://scikit-learn.org/stable/tutorial/

em vez de usar

    wget -r -l ( recourse | level) 

use

-m or mirror option which is a shortcut for -N -r -l inf --no-remove-listing

remove the -nd    ( no host directories )

que pode levar a problemas para quaisquer imagens css, etc., necessárias para que a página funcione, mesmo que você esteja usando o -k

    
por 26.05.2017 / 10:07

Tags