Eu prefiro usar --page-requisites
( -p
para breve) em vez de -r
aqui, pois ele baixa tudo o que a página precisa para exibir, mas nenhuma outra página, e eu não preciso pensar em que tipo de arquivos Eu quero.
Na verdade, geralmente estou usando algo como
wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
Isso significa:
-
-E
: Anexar.html
ao nome do arquivo, se ele for um arquivo HTML, mas não terminar em.html
ou similar -
-H
: Download de arquivos de outros hosts, também -
-k
: Após o download, converta qualquer link nele para que eles apontem para os arquivos baixados -
-p
: faça o download de qualquer coisa que a página precise para uma visualização off-line adequada