Use a opção --no-parent
no wget:
--no-parent
Do not ever ascend to the parent directory when retrieving recursively. This is a useful option, since it guarantees that only the files below a certain hierarchy will be downloaded.
Desejo baixar o seguinte subdomínio com a opção recursiva usando wget
:
www.example.com/A/B
Portanto, se esse URL tiver links para www.example.com/A/B/C
e www.example.com/A/B/D
, esses dois também deverão ser baixados.
Mas não quero que nada fora do subdomínio www.example.com/A/B
seja baixado. Por exemplo, se www.example.com/A/B/C
tiver um link para www.example.com
, a página www.example.com
deverá não ser baixada.
Qual comando wget
devo usar?
Tente usar a opção -I
para especificar o diretório a ser incluído no download:
wget -r -I www.example.com/A/B/C,www.example.com/A/B/D