Espelhe um blog com wget

9

Estou tentando espelhar um blog, por exemplo, www.example.com , com wget .

Eu uso o wget com as seguintes opções (as variáveis do shell são substituídas corretamente):

wget -m -p -H -k -E -np \
    -w 1 \
    --random-wait \
    --restrict-file-names=windows \
    -P $folder \
    -Q${quota}m \
    -t 3 \
    --referer=$url \
    -U 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070802 SeaMonkey/1.1.4' \
    -e robots=off \
    -D $domains
    -- $url

O blog contém imagens que residem em outros domínios.

Embora eu tenha especificado a opção -p (baixe os recursos da página vinculada), essas imagens não estão sendo baixadas, a menos que eu especifique cada domínio explicitamente na opção -D .

Se eu omitir a opção -D , o wget seguirá todos os links fora de www.example.com e baixará toda a Internet.

É possível que wget siga todos os links em www.example.com e faça o download dos recursos necessários de cada página, independentemente de eles residirem no mesmo domínio ou não, sem que eu precise especificar cada domínio explicitamente?

    
por Kostas Andrianopoulos 16.10.2014 / 05:17

1 resposta

1

Não, a única maneira é especificar os domínios que você deseja que o wget siga usando -D ou --domains = [lista de domínios] (na forma de lista separada por vírgulas)

    
por 21.11.2017 / 04:15