wget --mirror --convert-links yourdomain.com
Estou tentando fazer uma cópia estática completa de um site do Wordpress com wget
para navegar sem qualquer conexão de rede (todos os links e imagens devem ser convertidos).
Os diferentes requisitos para as páginas (imagens, css, js, ...) estão em 3 hosts Wordpress diferentes e estão sempre nos mesmos diretórios wp-content/uploads
.
Tentei limitar a recursão nos outros domínios a wp-content/uploads
diretórios com --domains
e --include-directories
, mas não posso limitar wget
a buscar somente esses diretórios nos $URL1
e $URL2
.
Aqui está a linha de comando (que não se limita a $URL0
e [$URL1|$URL2]/wp-content/uploads
):
wget --convert-links --recursive -l inf -N -e robots=off -R -nc
--default-page=index.html -E -D$URL1,$URL2,$URL0 --page-requisites
-B$URL0 -X$URL1,$URL2 --cut-dirs=1 -I*/wp-content/uploads/*, -H -F $URL0
Existe alguma possibilidade de limitar a recursão de wget
nos outros domínios a apenas alguns diretórios?
wget --mirror --convert-links yourdomain.com
Você acha que está procurando a opção include_directories
?
No manual :
‘include_directories = list’ ‘-I’ option accepts a comma-separated list of directories included in the retrieval. Any other directories will simply be ignored. The directories are absolute paths. So, if you wish to download from ‘http://host/people/bozo/’ following only links to bozo's colleagues in the /people directory and the bogus scripts in /cgi-bin, you can specify:
wget -I /people,/cgi-bin http://host/people/bozo/