Você pode usar wget
.
wget -r -np -k https://www.forth.com/starting-forth/
-
-r
recursivo -
-np
não segue links para diretórios pai -
-k
para fazer links em HTML ou CSS transferidos por download apontarem para arquivos locais
(De esta resposta )
(Edit) Os comandos finais:
wget -r -np -k -p --domains forth.com,netdna-ssl.com -H https://www.forth.com/starting-forth/
-
--domains
é usado para definir os domínios dos quais o conteúdo será baixado. Normalmente, este será apenas o site e um cdn. -
-H
permite o download de conteúdo de outros hosts (aqueles que você colocou em--domain
).
find . -name "*.html" -type f -exec sed -i 's/\?ver=/_ver=/g' {} +
Isso pesquisa todos os arquivos html e substitui as referências a ?ver
with _ver
, porque quando o wget faz o download de arquivos onde o URL contém algo como jquery.colorbox.js?ver=1.1.0
, ele precisa substituir o ?
por _
para salvá-lo como um arquivo.