Eu estou fazendo isso agora. Aqui está o comando que estou usando:
wget -k -m -E -p -np -R memberlist.php*,faq.php*,viewtopic.php*p=*,posting.php*,search.php*,ucp.php*,viewonline.php*,*sid*,*view=print*,*start=0* -o log.txt http://www.example.com/forum/
Eu queria despir essas coisas id ids da sessão (sid = blahblahblah). Eles parecem ser adicionados automaticamente pela página de índice e, em seguida, são anexados a todos os links de forma semelhante a vírus. Exceto por um squirreled away em algum lugar - que liga a um index.php simples que então continua sem o parâmetro sid =. (Talvez haja uma maneira de forçar o wget recursivo a iniciar do index.php - não sei).
Eu também excluí algumas outras páginas que levam a muita perda de arquivos. Em particular, memberlist.php e viewtopic.php, onde p = é especificado, pode criar milhares de arquivos!
Devido a esse erro no link do wget , ele ainda fará o download de um número surpreendente desses arquivos inúteis - especialmente visuais. php? p = ones - antes de simplesmente excluí-los. Então isso vai queimar muito tempo e largura de banda.