wget - Espelhando um site completo com requisitos em hosts diferentes

4

Estou tentando fazer uma cópia estática completa de um site do Wordpress com wget para navegar sem qualquer conexão de rede (todos os links e imagens devem ser convertidos).

Os diferentes requisitos para as páginas (imagens, css, js, ...) estão em 3 hosts Wordpress diferentes e estão sempre nos mesmos diretórios wp-content/uploads .

Tentei limitar a recursão nos outros domínios a wp-content/uploads diretórios com --domains e --include-directories , mas não posso limitar wget a buscar somente esses diretórios nos $URL1 e $URL2 .

Aqui está a linha de comando (que não se limita a $URL0 e [$URL1|$URL2]/wp-content/uploads ):

wget --convert-links --recursive -l inf -N -e robots=off -R -nc 
--default-page=index.html -E -D$URL1,$URL2,$URL0 --page-requisites 
-B$URL0 -X$URL1,$URL2 --cut-dirs=1 -I*/wp-content/uploads/*, -H -F $URL0

Existe alguma possibilidade de limitar a recursão de wget nos outros domínios a apenas alguns diretórios?

    
por user11689 20.10.2011 / 00:34

2 respostas

1

wget --mirror --convert-links yourdomain.com
    
por 07.11.2011 / 10:38
0

Você acha que está procurando a opção include_directories ?

No manual :

‘include_directories = list’ ‘-I’ option accepts a comma-separated list of directories included in the retrieval. Any other directories will simply be ignored. The directories are absolute paths. So, if you wish to download from ‘http://host/people/bozo/’ following only links to bozo's colleagues in the /people directory and the bogus scripts in /cgi-bin, you can specify:

          wget -I /people,/cgi-bin http://host/people/bozo/
    
por 13.07.2012 / 14:28