wget site espelho + recursos de outro domínio

1

Estou tentando baixar um site para que ele possa ser navegado off-line. Por isso, quero o html, imagens, css, javascript etc.

O problema é que as imagens não estão todas hospedadas no mesmo domínio que o site, da mesma forma que o css e o javascript. Algumas das imagens vêm de imgur, outras de outros sites de compartilhamento de arquivos. Em resumo, existem muitos domínios que possuem recursos usados por este site.

Como posso baixar o html do domínio único, mas obter os recursos usados por esse html de qualquer domínio?

    
por user2370460 15.02.2016 / 14:48

1 resposta

1

Você deve usar um conjunto de argumentos para intervalo de host :

Principalmente:

  • -H para percorrer para outros hosts que não os especificados
  • -D para especificar os domínios a serem incluídos
  • --exclude-domains para especificar domínios a serem excluídos

Por exemplo:

wget -rH --exclude-domains flickr.com myownsite.com
    
por 15.02.2016 / 15:57