Se você observar a origem da página, não verá nenhum link topics-cardiology.html
porque a barra lateral está sendo gerada por JavaScript. Você precisará usar um navegador sem cabeçalho JavaScript como CasperJS para criar um espelho completo.
Eu tentei fazer uma cópia do site wiredhealthresources.net
usando o comando:
wget -rpkl inf wiredhealthresources.net
Mas o comando só baixou 54 arquivos! A maioria das páginas está em falta, por ex. /topics-cardiology.html
, apesar de estar ligado a /index.html
O que eu fiz de errado? Por que wget
não está baixando o site inteiro?
Se você observar a origem da página, não verá nenhum link topics-cardiology.html
porque a barra lateral está sendo gerada por JavaScript. Você precisará usar um navegador sem cabeçalho JavaScript como CasperJS para criar um espelho completo.
Tenho certeza de que você não pode usar a opção inf
para modificar a profundidade, apenas para modificar as tentativas ou a consulta. Você já tentou usar -m
em vez de -r
e -l
? Parece que você quer espelhar a página e é para isso que o -m
é usado.