Faça o download de todo o stackexchange de hoje com o wget

2

Digamos que eu queira baixar recursivamente todas as postagens de hoje no stackexchange, bem como quaisquer artigos da wikipedia aos quais eles estejam vinculados.

 wget -kprcH -l 4 -t 3 stackexchange.com

não é uma boa opção, já que irá para muitos outros sites estrangeiros além da wikipedia e stackexchange. Se eu usar

wget -kprcH -l 4 -t 3 -D *stackexchange.com,*overflow.com,*overflow.net,*wikipedia.org stackexchange.com

Acabo de baixar uma e apenas uma página, "stackexchange.com"

Qual comando devo usar para baixar todo o stackexchange de hoje e todos os links da wikipedia que ele possa incluir sem baixar uma grande quantidade de materiais indesejados?

    
por FabulousGlobe 26.10.2015 / 20:38

1 resposta

0

Remova o "*" (asterisco) na frente dos sites. Eu tentei isso e baixei stackexchange e apenas o arquivo index.html da Wikipedia.com sem o conteúdo!

    
por 26.10.2015 / 20:45

Tags