Remova o "*" (asterisco) na frente dos sites. Eu tentei isso e baixei stackexchange e apenas o arquivo index.html da Wikipedia.com sem o conteúdo!
Digamos que eu queira baixar recursivamente todas as postagens de hoje no stackexchange, bem como quaisquer artigos da wikipedia aos quais eles estejam vinculados.
wget -kprcH -l 4 -t 3 stackexchange.com
não é uma boa opção, já que irá para muitos outros sites estrangeiros além da wikipedia e stackexchange. Se eu usar
wget -kprcH -l 4 -t 3 -D *stackexchange.com,*overflow.com,*overflow.net,*wikipedia.org stackexchange.com
Acabo de baixar uma e apenas uma página, "stackexchange.com"
Qual comando devo usar para baixar todo o stackexchange de hoje e todos os links da wikipedia que ele possa incluir sem baixar uma grande quantidade de materiais indesejados?
Tags wget