Estou tentando baixar dois sites para inclusão em um CD:
http://boinc.berkeley.edu/trac/wiki
http://www.boinc-wiki.info
O problema que estou tendo é que estes são ambos wikis. Então, ao fazer o download com, por exemplo:
wget -r -k -np -nv -R jpg,jpeg,gif,png,tif http://www.boinc-wiki.info/
Eu obtenho um lote de arquivos porque ele também segue links como ...? action = edit ...? action = diff & version = ...
Alguém sabe uma maneira de contornar isso?
Eu só quero as páginas atuais, sem imagens e sem diffs, etc.
P.S .:
wget -r -k -np -nv -l 1 -R jpg,jpeg,png,gif,tif,pdf,ppt http://boinc.berkeley.edu/trac/wiki/TitleIndex
Isso funcionou para berkeley, mas o boinc-wiki.info ainda está me causando problemas: /
P.P.S:
Eu tenho o que parece ser as páginas mais relevantes com:
wget -r -k -nv -l 2 -R jpg,jpeg,png,gif,tif,pdf,ppt http://www.boinc-wiki.info