wget recursivo limitado dentro do subdomínio

7

Desejo baixar o seguinte subdomínio com a opção recursiva usando wget :

www.example.com/A/B

Portanto, se esse URL tiver links para www.example.com/A/B/C e www.example.com/A/B/D , esses dois também deverão ser baixados.

Mas não quero que nada fora do subdomínio www.example.com/A/B seja baixado. Por exemplo, se www.example.com/A/B/C tiver um link para www.example.com , a página www.example.com deverá não ser baixada.

Qual comando wget devo usar?

    
por Paul S. 08.10.2012 / 21:48

2 respostas

9

Use a opção --no-parent no wget:

--no-parent

Do not ever ascend to the parent directory when retrieving recursively. This is a useful option, since it guarantees that only the files below a certain hierarchy will be downloaded.

    
por 08.10.2012 / 21:50
2

Tente usar a opção -I para especificar o diretório a ser incluído no download:

wget -r -I www.example.com/A/B/C,www.example.com/A/B/D
    
por 08.10.2012 / 21:51

Tags